《谁说菜鸟不会数据分析》学习笔记 第五章数据分析

第五章 数据分析

  • 5.1 数据分析方法
    • 现状分析
      • 5.1.1 对比分析法
      • 5.1.2 分组分析法
      • 5.1.3 结构分析法
      • 5.1.4 分布分析法
      • 5.1.5 交叉分析法
      • 5.1.6 RFM分析法
      • 5.1.7 矩阵关联分析法
      • 5.1.8 综合评价分析法
    • 原因分析
      • 5.1.9 结构分解法
      • 5.1.10 因素分解法
      • 5.1.11 漏斗图分析法
    • 预测分析
      • 5.1.12 趋势分析法
    • 高级数据分析方法
  • 5.2 数据分析工具——数据透视表

本章讲了用于现状分析、原因分析和预测分析的12种数据分析方法。
现状分析,结构分析法,分析定性数据,看组成看成分。分布分析法,分析定量数据,看分布,比如时间分布、收入分布、年龄分布等。
现状分析,交叉分析法和矩阵分析的区别在于,交叉分析法以交叉表的形式进行变量间关系的对比分析。矩阵分析,则以事物的两个重要属性(指标)作为分析依据,做矩阵图分析每一个对象在这两个属性上的表现。
原因分析,结构分解法用于数量类指标,因素分解法用于质量类指标。但感觉实际应用中不用分这样清楚地分清楚吧,比如利润,我感觉是数量类指标,但是可以用因素分解法,利润=收入-成本-其他,也可以按结构分解,哪个分公司哪个部门的利润。

5.1 数据分析方法

数据分析方法三大作用即现状分析、原因分析、预测分析,这三大作用分别通过 对比、细分、预测三大基本方法。
在这里插入图片描述

现状分析

在这里插入图片描述

5.1.1 对比分析法

任何事物既有共性又有个性特征,只有通过对比,才能分辨出事物的性质、变化、发展、与其他事物的异同等个性特征。
1、定义
对比分析,是指将两个或以上的数据进行比较 ,分析差异,从而揭示事物发展变化情况和规律性。
2、指标与维度
数据分析需要对指标从不同的维度进行对比分析,才能得出有效的结论。
1)指标
指标是用于衡量事物发展程度的单位或方法,它还有一个在IT领域常用的名字,称为度量
指标需要经过计数、加和、平均等汇总计算方式得到,并需要在一定的前提条件下进行汇总计算,如时间、地点、范围,这就是常说的统计口径与范围。
指标可分为绝对数指标和相对数指标,绝对数指标是反映规模大小的指标,而相对数指标主要用来反映质量的高低。所以,分析一个事物的发展程度可从数量(quantity)和质量(quality)这两个方面的指标进行对比分析,简称QQ模型,也称为QQ模型分析法。
在这里插入图片描述
第一个Q,就是数量,也就是我们常说的绝对数指标,例如收入、用户数等,主要用来衡量事物发展的规模大小情况
第二个Q,就是质量,也就是我们常说的相对数指标,例如利润率、留存率等,主要用来衡量事物发展的质量高低情况。
质量又可分为广度和深度两个角度
广度是指群体覆盖的范围,例如:留存率、渗透率、付费率等
深度是指群体参与的深度,例如:人均消费额、人均GDP、人均收入、人均在线时长
例如,在分析业务时,先分析业务是否达到一定规模,若规模足够大,可再分析质量高低。若质量不高则可从提升质量的角度入手,收入与利润率、用户数与留存率等组合分析都是QQ模型的经典应用。
2)维度
指标用于衡量事物发展程度,程度是好是坏,需要通过不同维度进行对比,才能知道好坏。
维度是事物或现象的某种特征,也就是我们常说的分析角度,如产品类型、用户类型、地区、时间等都是维度。
同级类别对比
同级类别对比,称为横比,如不同国家人口数、GDP的对比。
不同时期对比
时间是常用的、特殊的维度,时间上的对比,称为纵比。本月与上月数据对比为环比,本月与去年同月数据对比为同比,每月数据与某一固定月数据对比为定基比。
除了横比与纵比外,还可与业务目标进行对比,与行业的平均水平、标杆进行对比。
与目标对比
实际完成值与目标对比。
行业内对比
与行业内标杆企业、竞争对手或行业的平均水平进行对比。
还有其他对比分析的维度。

根据数据类型划分,维度可分为定性维度和定量维度。
数据类型为字符型数据,就是定性维度,它是事物的固有特征属性,如产品类型、用户类型、地区都是定性维度。
数据类型为数值型数据,就是定量维度,如收入、消费、年龄等,一般需要对定量维度进行数值分组处理,再进行对比等分析。

3、注意事项
1)只有通过事物发展的数量、质量两大方面的指标,从横比、纵比角度进行全方位的对比,才能够全面了解事物发展的情况与规律。
2)指标的口径范围、计算方法、计量单位必须一致,即要用同一种单位或标准去衡量。例如600美元与3000人民币无法直接比较
3)对比的指标类型必须一致,无论绝对数指标、相对数指标,还是其他不同类型的指标,在进行对比时,双方必须统一。例如2010年广州的GDP值和深圳的GDP增长率无法对比,因为两种指标类型不一样。

5.1.2 分组分析法

分组分析法,是指根据分组字段,将分析对象划分成不同的部分,以对比分析各组之间的差异的一种分析方法。
分组的目的是为了便于对比,把总体中具有不同性质的对象区分开,把性质相同的对象合并在一起,以便进一步进行各组之间的对比分析。
分组类型主要有两类:定性分组和定量分组。
定性分组:是按事物的固有属性划分的,如性别、学历、地区等属性,定性分组一般看结构,也就是结构分析。
定量分组:即数值分组,根据分析目的将数值型数据进行等距或非等距分组,定量分组一般看分布,也就是分布分析。

5.1.3 结构分析法

结构分析法,是在分组的基础上,计算各组成部分所占的比重,进而分析总体内部构成结构。这个分组主要是指定性分组,定性分组一般看结构,它的重点在于占整体的比重。例如用户的性别结构、公司的产品结构等。
结构相对指标(比例)的计算公式为:
结构相对指标(比例)=(总体某部分的数值/总体总量)×100%
市场占有率是结构分析的一个经典应用
市场占有率=(某种商品销售量/该种商品市场销售总量)×100%
市场占有率高说明企业运营状况好,竞争能力强,在市场上占据有利地位,所以评价一家企业运营状况是否良好,不仅要了解客户数、收入等绝对数值指标是否增长,而且还要了解其在行业内的比重是否维持稳定或也在增长,若比重下降,说明竞争对手增长快,即企业在退步,要提高警惕,出台相应政策。
结构分析主要使用饼图进行数据展现,若成分较少,可考虑用圆环图,若成分较多,如10个以上,考虑使用树状图。
在这里插入图片描述

5.1.4 分布分析法

分布分析法,是根据分析目的,将数值型数据进行等距或不等距分组,研究各组分布规律的一种分析方法。
分布分析法也是在分组基础上进行的,这个分组主要是指定量分组,定量分组一般看分布。分布分组的重点在于查看数据的分布情况,其横坐标轴不能改变顺序,即不能按数值大小进行排序。分布分组应用广泛,例如,用户消费分布、用户收入分布、用户年龄分布。
在这里插入图片描述
定量分组分析的关键在于确定组数和组距。
除了等距分组还可以不等距分组,取决于所分析对象的性质特点。在各单位数据变动比较均匀的情况下适合采用等距分组,在各单位数据变动不均匀的情况下可适合采用不等距分组,数据分析师根据需要进行选择。
还有一种特殊的分布分析,就是时间分布分析。例如,用户注册时段分布、用户购买时段分布、产品月销售分布等。

5.1.5 交叉分析法

交叉分析法,通常用于分析两个或两个以上分组变量之间的关系,以交叉表的形式进行变量间关系的对比分析。交叉分析的原理就是从数据的不同维度,综合进行分组细分,以进一步了解数据的结构、分布特征。
交叉分析的分组变量,可以是定量分组与定量分组进行交叉,也可以是定量分组与定性分组进行交叉,还可以是定性分组与定性分组进行交叉。
交叉分析的维度,建议不超过2个,维度越多,分得越细,就越没有重点,所以在选择几个维度的时候需要根据分析的目的决定。
二维交叉表其实就是二维表,下面给出一个二维交叉表。
在这里插入图片描述

5.1.6 RFM分析法

根据客户活跃程度和交易金额贡献,进行用户价值细分的一种客户细分方法。RFM分析法其实是交叉分析在客户价值细分领域的一个经典应用。RFM分析法由三个指标组成,分别为R(recency)近度、F(frequency)频度、M(monetary)额度组成。
在这里插入图片描述
高表示高于该指标的平均值,低表示低于该指标的平均值。
在这里插入图片描述
使用RFM分析法,需要满足以下三点假设:
(1)假设最近有过交易行为的客户,再次发生交易的可能性要高于最近无交易的客户**(R)**
(2)假设交易频率较高的客户比交易频率较低的客户更有可能再次发生交易行为**(F)**
(3)假设过去所有交易总金额较多的客户,比交易总金额较少的客户,更有消费积极性**(M)**

5.1.7 矩阵关联分析法

1、矩阵
矩阵分析,是指将事物的两个重要属性(指标)作为分析的依据,进行关联分析,找出解决问题的一种分析方法,也称矩阵关联分析,简称矩阵分析法。
矩阵以属性A为横轴,属性B为纵轴,组成一个坐标系,在两坐标轴上分别按某一标准(可取平均值、经验值、行业水平等)进行象限划分,构成四个象限。将要分析的每个对象对应投射到这四个象限内,进行交叉分类分析,直观地将两个属性的关联性表现出来,进而进行每一个对象在这两个属性上的表现。
在这里插入图片描述
矩阵关联分析法在解决问题和资源分配时,可为决策者提供重要参考依据,先解决主要矛盾,再解决次要矛盾。

2、改进难易矩阵
若企业存在较多短板,而自身拥有资源(如人力、物力等)有限,只能先集中有限资源对某个短板进行改造,这时可在原有两个指标的基础上,增加一个指标维度,例如改进难易程度。
改进难以程度这个指标可以采用专家访谈获取多位业内专家对各个指标改进难易程度的评价,最后综合各专家的评价以确定最终指标的改进难易程度。
在这里插入图片描述
图中气泡面积的大小代表着改进的难易程度,气泡越大,改进难度越大。

5.1.8 综合评价分析法

通过对实践活动的总结,逐步形成了一系列运用多个指标对多个参评单位进行评价的方法,称为多变量综合评价分析方法,简称综合评价分析法。
综合评价分析法的基本思想是将多个指标转化为一个能够反映综合情况的指标来进行分析评价。例如不同国家的经济实力,不同地区的社会发展水平等。
在这里插入图片描述
综合分析法特点:
在这里插入图片描述

原因分析

在这里插入图片描述

5.1.9 结构分解法

针对数量类的指标,可使用结构分解法进行指标变化的原因分析。
结构分解法采用金字塔形结构,可使业务结构的层次更分明、条理更清晰,简单明了地表达了各业务结构之间的关系。
例子:
公司4月收入比3月下降10%,原因何在?
在这里插入图片描述
原因:4月品牌2的收入比3月下降22%,地区对收入下降没明显影响。

5.1.10 因素分解法

针对质量类的综合性指标,可以使用因素分解法进行指标变化的原因分析。
因素分解法把综合性指标分解为各个原始因素,主要用于分析有明确数量关联关系的各因素之间的变动对综合指标变动量的影响程度,从而确定影响指标变化的原因。
因素分析法的具体操作步骤如下。
(1)确定指标有哪些因素构成
(2)确定各因素与指标的关系,如加减乘除或函数等
(3)测定、分析因素对指标变动的影响方向和程度
在这里插入图片描述
原因分析:
在这里插入图片描述
在这里插入图片描述

5.1.11 漏斗图分析法

漏斗图分析法是以漏斗的形式展现分析过程及结果,也就是从业务流程角度进行对比分析,通过各环节变化查找指标变化的原因。
在这里插入图片描述

预测分析

在这里插入图片描述

5.1.12 趋势分析法

预测分析法是根据客观对象的已知信息,运用各种定性和定量的分析理论与方法,对事物未来发展的趋势和水平进行判断和推测的一种活动。
在这里插入图片描述
定性预测靠经验
定量用数学工具

预测分析的结果需要符合业务发展规律,相关的预测分析技术,如趋势分析法、回归分析、时间序列等方法得到的预测结果仅仅作为参考,需要根据相关的运营策略、资源配置等情况决定是否修正预测结果,并不是直接采用它们的预测结果。

给出了excel预测的步骤

高级数据分析方法

高级数据分析方法为解决更复杂的业务问题。
在这里插入图片描述

5.2 数据分析工具——数据透视表

这部分讲了3个数据透视表的操作的重要内容:
1、数据透视表创建三步法
举例:销售额相关的6个问题(数据透视表的简单运用)
2、数据透视表3个小技巧
百分比计算
同比、环比计算
数据分组统计(用组合命令)
3、多选题分析
品牌认知度相关的4个数据透视表问题(数据透视表的简单运用)
涉及到利用分组命令对年龄分组或者用vlookup函数实现年龄分组

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/353241.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

产品读书《谁说菜鸟不会数据分析(工具篇)》

系列二:谁说菜鸟不会数据分析(工具篇) PPT查看1 、PPT查看2 第一章 : 高效处理数据 查询语法: SELECT 字段1,字段2,字段3 FROM 表 WHERE 条件1 AND 条件2 AND 字段 IN(条件1,条件2,条件3) O…

《谁说菜鸟不会数据分析》之探索性数据分析

探索性数据分析是运用一些分析方法从大量的数据中发现未知且有价值信息的过程。 分类 探索性数据分析可分为以下4种: * RFM分析 * 聚类分析 * 因子分析 * 对应分析 RFM分析 RFM分析是针对销售行为的一种分析方法,在SPSS中有对应的分析模块&#…

产品读书《谁说菜鸟不会数据分析(入门篇)》

PPT查看1 PPT查看2 思维导图下载 ppt下载 什么是数据分析?怎么样才是数据分析的思维?数据分析的流程有哪些?常用的数据方法又有哪些?工具呢?可以学习的网站有哪些?我觉得《谁说菜鸟不会数据分析&#…

谁说菜鸟不会数据分析,不用Python,不用代码也轻松搞定

作为一个菜鸟,你可能觉得数据分析就是做表格的,或者觉得搞个报表很简单。实际上,当前有规模的公司任何一个岗位如果没有数据分析的思维和能力,都会被淘汰,数据驱动分析是解决日常问题的重点方式。 很多时候&#xff0c…

【HTML】第 1 节 - HTML 初体验

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 。 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、HTML 概念 2.1、HTML 定义 2.2、标签语法 3、HTML 基本骨架 4、标签的关系 5、注释 6、总结 1、缘起 最近在学习微信小程…

《谁说菜鸟不会数据分析(入门篇)》总结

一、数据分析方法论 营销方面:4P、用户使用行为、STP理论、SWOT 管理方面的理论模型:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等 PEST(宏观环境分析)P(political)政治环境(社会性质、执政党性质…

《谁说菜鸟不会数据分析》

一、数据分析概况 (一)、数据分析是“神马”? 1.数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们进行汇总、理解并消化, 以求最大化的开发数据的功能 ,发回数据的作用。 2.数据分析…

谁说菜鸟不会数据分析(SPSS篇)----- 学习笔记

SPSS变量尺度跟数据类型百分位值:将数据从小到大排序,用n-1个数据点将数据分成n等份集中趋势:反映数据向其中心值凝聚的程度,对数据一般水平的概括性度量离散趋势:反映数据偏离中心值的程度,是衡量集中趋势…

谁说菜鸟不会数据分析 | 学习笔记 (全)

一.前言 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。在实际工作中,数据分析能够帮助管理者进行判断和决策&…

java SSM 互助旅游管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java SSM 互助旅游管理系统是一套完善的web设计系统(系统采用SSM框架进行设计开发,springspringMVCmybatis),对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采…

元宇宙,现状,路径与未来

现在,如果你还不知道元宇宙这个词,那应该直接投诉村村通工程怎么还没修到乡下..…事实上,自从半年前,当已经头发斑白的路边大爷摇在躺椅上一边喝着茶一边问我什么是元宇宙时,我就察觉到元宇宙在各种人士的吹捧下已经火…

Linux 如何查看 隐藏文件大小,某个文件大小,文件夹大小

du -sh dir or file du -sh 后面跟目录或者文件,你要看哪个文件或者文件夹的大小,后面就跟上名字就好,可以写n个。 我截图的后面就是一下看了四个文件夹的大小 命令是简单,记录一下,免得下次用的时候,又…

win11怎么查看隐藏文件

出于隐私等方面的考虑,有些网友给自己的文件做了一些隐藏的处理,但是时间久后就不知道隐藏文件在哪里,该怎么找到win11隐藏文件。那么win11怎么查看隐藏文件?下面小编就教下大家查看win11隐藏文件的方法。 我们需要先取消文件隐藏…

查看计算机桌面隐藏文件夹,电脑怎么查看隐藏文件(隐藏文件夹显示方法)

很多朋友在使用电脑的时候,都会将一些较隐私的文件给隐藏起来,怎么隐藏文件相信都难不倒大家。但是该如何将隐藏文件显示出来呢?这可以说是难道了一大片朋友,针对这一问题,这里小编就给大家介绍显示隐藏文件夹的操作方法。 相信大…

Linux下查看隐藏文件命令

参考 Linux下查看隐藏文件命令 - 云社区 - 腾讯云 一般的Linux下的隐藏目录使用命令ls -l是查看不出来的,只能查看到文件及文件夹 查看Linux下的隐藏文件需要用到命令 ls -al 其他查看文件目录命令: ls -lll ls -l /

macOS: 查看隐藏文件

在Mac下,如果无法显示隐藏文件: 按 command shift . 即可显示隐藏文件: 复按 command shift . 即可再次将之隐藏:

winscp 查看隐藏文件

WinSCP是一个Windows环境下使用SSH的开源图形化SFTP客户端,个人觉得非常好用,下面讲一下我遇到的问题吧今天要修改.htaccess 问题,之前使用WinSCP都没有发现这个问题,今天发现没有办法在远程的目录里找到隐藏的.htaccess这里解释一…

跟着LearnOpenGL学习6--变换

文章目录 一、前言二、向量2.1、向量与标量运算2.2、向量取反2.3、向量加减2.4、长度2.5、向量相乘 三、矩阵3.1、矩阵的加减3.2、矩阵的数乘3.3、矩阵相乘 四、矩阵与向量相乘4.1、单位矩阵4.2、缩放4.3、位移4.4、旋转4.5、矩阵的组合 五、变换实战5.1、GLM配置5.2、GLM测试5…

流氓软件篡改微软EDGE浏览器主页面的那些伎俩

微软的EDGE浏览器很好用,但也很容易被绑架,在网上下载各类免费软件,只要你安装完,十有八九就给你把主页改成某某导航了。尽管打开EDGE直接进入360、毒霸、好123等链接对上网影响也不大,打开这些导航页面后,…

npm install报错 -> npm ERR! Unexpected token ‘.‘ 报错解决办法

原因: 我遇到这个问题的场景是用nvm1.1.7的版本安装了16.x以上的node, 然后再下载依赖的时候就报错了 总结一下就是nvm版本太低了,他的里面没有集成高版本node导致的 解决: 我们把nvm版本换到最新的就可以了 1. 卸载掉当前所有的node nvm …