数据分析01——系统认识数据分析

1.数据分析的全貌

1.1观测

1.1.1 观察

(1)采集数据

a.采集数据:解析系统日志

当你在看视频的时候———就会产生日志———解析日志———得到数据

b.采集数据:埋点获取新数据(自定义记录新的信息)

日志记录你观看视频的IP,通过IP的解析,就可以知道你的观看地址。而这整个基于系统日志新增的数据过程,就称为埋点。

埋点是分析师获取新数据的主要方式,也是最可控、最可靠的方式。

c.采集数据:通过传感器采集

d.采集数据:爬虫

e.采集数据:API(Application Programing Interface)

(2)储存数据

a.储存数据:各种类型的数据库

数据采集得到的数据都放在数据库,由专门另外的程序员去维护开发,而不是放在本地磁盘里。

b.储存数据:连接数据库取数

(3)展示数据

a.展示数据:可视化高效传达信息

1.1.2 测量

设定标准、发现异常、研究关系

 分析数据的目的是什么?

一、及时发现异常

二、找到数据之间的因果关系

数据是客观统一的

在任何人眼里:1+1=2

有统一的认知才能有共同的目标

(1)设定标准+发现异常

例如:今年的销售额是一千两百万,平均到每个月就一百万,如果每个月都完成到一百万以上的目标,一定能够完成。此时,每个月一百万就是一个正常的数据。我们只需要拿这个数据作为判断标准,就能够客观衡量当前业务的情况。
在经典的咨询的场景里面,数据标准称为Benchmark,也是进行分析判断的重要依据。如果当月的销售额低于了一百万,就称为出现了异常,对异常值的发现,可以让企业避免不必要的损失。
(2)研究关系

1.2实验

1.2.1 拆解问题、提出假设、设计实验

(a)提出假设,然后验证假设

例如外卖收到差评率变多了--->假设是因为恶劣天气引起的—>通过一次次的验证,就可以得到一个规律,确实是因为恶劣的天气造成的

提示:所有未经事实数据验证的想法都是假设

设计A/B测试获取数据

1.2.2 收集数据、分析数据、验证假设

1.3 应用

  • 制定策略、实施策略、反馈迭代
  • 训练算法、优化算法、使用算法

如何应用数据创造价值?

(1)基于数据反馈不断迭代产品和业务策略

(2)基于数据训练算法,让机器自动化地完成工作

1.3.1 拆解方法(自己整理)

拆解只要符合MECE法则即可

(1)流程拆解法

流程拆解法就是按照事情发展的时间、流程、程序,对过程进行逐一的拆解。

例如:分解消费者的购物过程:看见广告->点进-点击购买->付款->下单->支付。类似于漏斗分析法,是一种流程分析,适用于流程长,环节较多,并且随着环节的进行,留存率越来越少的场景。

(2)二分法

二分法在日常生活中比较常见,就是把事物分成A和非A两个部分,如“白天、黑夜”、“男人、女人”、“国内、国外”、“内部、外部”等。

二分法用于简化思维,当一件事情很复杂,超出理解范围,又需要快速做出决策,那么就可以用二分法来简化事物,快速完成决策。

(3)象限拆解法

象限拆解法是数据分析中常用的一种方法,主要用于分析数据集中的趋势、关联或者特征。它通常应用于二维数据,将数据分布根据两个维度进行分类,形成四个象限。

采用横向坐标法,将所要分析的信息分为四个象限,从高到低分别进行分析。

  1. 有助于发现问题的共同成因:采用象限分析方法,对具有相似特点的事件进行归因分析,归纳出共同的成因。
  2. 建立分类最优策略:根据输入的象限分析方法,可以根据不同的象限来确定最优策略。

例如:X轴从左到右的点击率的高低,Y轴从下到上是转化率的高低,形成了4个象限,这就是我们要说的象限分析法。针对每次营销活动的点击率和转化率找到相应的数据标点,然后将这次营销活动的效果归到每个象限,4个象限分别代表了不同的效果评估。

象限一:高点击转化,点击高代表营销创意打动了受众,转化高代表被打动的首众是产品的目标用户。

象限二:高转化低点击,同样的,高点击代表被打动的受众是产品的目标用户,但低点击代表的是营销创意没有打动用户;

象限三:低点击低转化,这个象限是最糟糕的营销活动了,投放广告点击少,点击用户转化低,创意无效,用户不精准;

象限四:高点击低转化,这个象限的营销活动要给策划和文案加鸡腿,但就要给渠道扣绩效了。这种象限的营销活动一定程度上有标题党的嫌疑。

(4)杜邦分析法

杜邦分析法是利用几种主要的财务比率之间的关系来综合地分析企业的财务状况,具体来说,是一种用来评价公司盈利能力和股东权益回报水平,从财务角度评价企业绩效的一种经典方法。

其基本思想是将企业净资产收益率逐级分解为多项财务比率乘积,这样有助于深入分析比较企业经营业绩。

(5)AARRR模型

AARRR是一个用于研究用户增长的数据分析模型,是Acquisition、Activation、Retention、Revenue、Refer这五个单词的缩写,分别对应用户生命周期的用户获取、用户激活、用户存留、获得收益、推荐传播这五个环节。

(6)PEST模型

PEST分析法就是从政治(Political)、经济(Economic)、社会(Society)、技术(Technology)四个方面,基于公司战略的眼光来分析企业外部宏观环境的一种方法。

公司的发展战略与宏观环境息息相关,PEST分析可以更好地把握宏观经济形势和发展趋势,从而更好地把握公司的生存发展机遇,及时发现和规避环境的潜在风险。

(7)RFM模型

RFM模型是指根据客户活跃度和交易金额贡献,进行客户价值细分的一种方法。主要应用于精细化运营、用户分层分析、用户会员体系建立。

根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:

  • 最近一次消费(Recency)
  • 消费频率(Frequency)
  • 消费金额(Monetary)

(8)SWOT模型

SWOT模型分析法代表企业优势(Strength)、劣势(weakness)、机会(opportunity)和威胁(threats)。

SWOT分析实质上是一种综合和总结企业外部环境的各种因素,从而分析企业的优势、劣势、机遇和威胁的一种方法,可以通过分析帮助企业把资源和行动集中在自己的强项和有最多机会的地方。

(9)5W1H模型

Who(分析对象) 确定主题对象

Where(从哪里获取数据)进行数据集成

When(获取哪些时间段的数据)确定时间间隔

What(用什么分析方法)具体的手段方法

Why (什么原因导致的)背景和根本原因

How (如何呈现最终结果)分析报告

1.3.2 将数据应用于业务

1.3.3 将数据应用于算法

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/3247608.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

数据建模标准-关系建模

数据模型定义:DAMA数据治理体系中将数据模型定义为一种文档形式,数据模型是用来将数据需求从业务传递到IT,以及在IT内部从分析师、建模师和架构师到数据库设计人员和开发人员的主要媒介; 作用:记录数据需求和建模过程中产生的数据…

应用最优化方法及MATLAB实现——第4章代码实现

一、概述 之前对这本书的第三章进行了代码实现,这篇博客是对这本书第4章相关代码进行实现,部分内容安装书中代码无法实现相应功能,MATLAB会报错,对其进行一定程度的更改后,可以正常运行,与书中所给示例运行…

亲测--linux下安装ffmpeg最新版本---详细教程

下载地址 Download FFmpeg 下载最新的https://ffmpeg.org/releases/ffmpeg-7.0.1.tar.xz 上传到服务器 解压 tar xvf ffmpeg-7.0.1.tar.xz 编译 cd ffmpeg-7.0.1 ./configure --prefix=/usr/local/ffmpeg make && make install 报错: 解决:在后面加 跳过检测…

Template_C++

C模板 C提供了function template. function template:实际上是建立一个通用函数,其函数类型和形参类型不具体制定,用一个虚拟的类型来代表。这个通用的函数就称为函数模版。 是不是可以这样理解,函数模版就是给了一种功能&…

线程的中断和同步问题

1、自动终断【完成】:一个线程完成执行后(即run方法执行完毕),不能再次运行 。 2、手动中断: stop( ) —— 已过时,基本不用。(不安全,就像是突然停电) interrupt( ) …

从0到1搭建数据中台(4):neo4j初识及安装使用

在数据中台中,neo4j作为图数据库,可以用于数据血缘关系的存储 图数据库的其他用于主要用于知识图谱,人物关系的搭建,描述实体,关系,以及实体属性 安装 在官网 https://neo4j.com/ 下载安装包 neo4j-co…

系统架构师考点--面向对象开发

大家好。今天再来总结一下面向对象的相关考点。面向对象技术。这部分在上午场客观题一般占3-5分左右。下午的案例题和论文题也可能有所涉及。 一、面向对象开发 (1)对象:由数据及其操作所构成的封装体,是系统中用来描述客观事务的个实体,是…

【算法/天梯赛训练】天梯赛模拟题集

L1-009 N个数求和 #include <iostream> #include <algorithm>using namespace std;typedef long long ll; const int N 105;typedef struct node {ll x, y; }node; node a[N];ll gcd(ll a, ll b) {return b ? gcd(b, a % b) : a; }int main() {int n;cin >>…

Lua基础知识入门

1 基础知识 标识符&#xff1a;标识符的定义和 C语言相同&#xff1a;字母和下划线_ 开头&#xff0c; 下划线_ 大写字母一般是lua保留字&#xff0c; 如_VERSION 全局变量&#xff1a;默认情况下&#xff0c;变量总是认为是全局的&#xff0c;不需要申明&#xff0c;给一个变…

ECMP等价多路由机制,大模型训练负载均衡流量极化冲突原因,万卡(大规模)集群语言模型(LLM)训练流量拥塞特点

大规模集群&#xff0c;大语言模型(LLM)训练流量特点&#xff0c;ECMP&#xff08;Equal-Cost Multi-Path Routing&#xff09;流量极化拥塞原因。 视频分享在这&#xff1a; 2.1 ECMP等价多路由&#xff0c;大模型训练流量特点&#xff0c;拥塞冲突极化产生原因_哔哩哔哩_bi…

vue2导入elementui组件库

第一步安装 npm i element-ui -S 第二步在main.js中导入 第三步使用然后在运行项目

Linux——五种IO模型

目录 一、I/O的理解 二、五种IO模型 1.阻塞式IO 2.非阻塞式IO 3.信号驱动IO 4.多路复用IO 5.异步IO 一、I/O的理解 I/O的本质就是输入输出&#xff0c;C语言的stdio&#xff0c;C的iostream&#xff0c;添加了这两个库&#xff0c;我们才能够进行printf、scanf、cin、c…

【HarmonyOS】HarmonyOS NEXT学习日记:三、初识ArkUI

【HarmonyOS】HarmonyOS NEXT学习日记&#xff1a;三、初识ArkUI 忘掉HTML和CSS&#xff0c;ArkUI里构建页面的最小单位就是 “组件”&#xff0c;所以今天的目标就是认识一些常用的基础组件&#xff0c;以及他们的用法&#xff0c;对ArkUI形成一个基本认识。 基本组成 了解…

【前端】表单密码格式—校验。

如图&#xff1a;实现表单输入密码和确认密码的时候进行表单校验。 实现方式&#xff1a; 1.在代码的data里面定义&#xff0c;函数验证的方法。如图所示,代码如下 【代码】如下&#xff1a; const validatePassword (rule, value, callback) > {if (value ) {callback(n…

MongoDB自学笔记(三)

一、前文回顾 上一篇文章中我们学习了更新操作&#xff0c;以及讲解了部分的更新操作符&#xff0c;今天我们继续学习剩余的更新操作符。 二、更新操作符 1、$rename 语法&#xff1a;{ $rename: { < field1 >: < newName1 >, < field2 >: < newName2…

Java语言程序设计基础篇_编程练习题**14.29(游戏:豆机)

第十四章第二十九题 **14.29 (游戏&#xff1a;豆机) 请写一个程序&#xff0c;显示编程练习题 7.21 中介绍的豆机&#xff0c;如图 14-52c 所示 代码展示 package chapter_14;import javafx.application.Application; import javafx.scene.Scene; import javafx.scene.layou…

【ffmpeg命令入门】重新编码媒体流、设置码率、设置帧速率

文章目录 前言ffmpeg的描述重新编码媒体流重新编码媒体流的命令ffmpeg支持的媒体流 设置视频码率视频码率是什么设置视频的码率 设置文件帧数率帧数率是什么ffmpeg设置帧数率 总结 前言 在数字媒体处理领域&#xff0c;ffmpeg是一款非常强大的工具&#xff0c;它可以用来进行媒…

Java | Leetcode Java题解之第242题有效的字母异位词

题目&#xff1a; 题解&#xff1a; class Solution {public boolean isAnagram(String s, String t) {if (s.length() ! t.length()) {return false;}int[] table new int[26];for (int i 0; i < s.length(); i) {table[s.charAt(i) - a];}for (int i 0; i < t.leng…

【面试题】Redo log和Undo log

Redo log 介绍Redo log之前我们需要了解一下&#xff0c;mysql数据操作的流程&#xff1a; 上述就是数据操作的流程图&#xff0c;可以发现sql语句并不是直接操作的磁盘而是通过操作内存&#xff0c;然后进行内存到磁盘的一个同步。这里我们必须要了解一些区域&#xff1a; 缓…

基于 asp.net家庭财务管理系统设计与实现

博主介绍&#xff1a;专注于Java .net php phython 小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设&#xff0c;从业十五余年开发设计教学工作 ☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不然下次找不到哟 我的博客空间发布了1000毕设题目 方便大家学习使用感兴趣的可以先…