《谁说菜鸟不会数据分析》之数据分析

什么是数据分析?

顾名思义,数据分析就是对数据进行分析。
可是,数据分析的真正定义是什么呢?
数据分析是指利用适当的统计分析方法对收集来的大量数据进行分析,将他们加以汇总消化并理解,以最大化地开发数据功能,发挥数据的作用。

数据分析有哪几类?

数据分析可分为:
* 描述性数据分析
* 探索性数据分析
* 验证性数据分析
下面简单介绍一下,描述性数据分析属于初级数据分析,常用的数据分析方法有对比分析、平均分析、交叉分析等。
探索性数据分析侧重于在数据发现未知的新的特征;验证性分析侧重于验证已有假设的真伪证明。
后两者属于高级数据分析,常用的分析方法有相关性分析、因子分析、回归分析等。

数据分析有什么作用?

* 现状分析
* 原因分析
* 预测分析

数据分析六部曲

* 明确分析目的和思路
* 数据收集
* 数据处理
* 数据分析
* 数据展现
* 报告撰写

明确数据分析目的以及确定分析思路,是确保数据分析过程有效进行的先决条件,可以为数据收集、处理以及分析提供清晰的指引方向。
在明确数据分析目的后,就要梳理分析思路,搭建分析框架,并把分析目的分解成若干个不同的分析要点,及如何开展数据分析,需要从那几个角度进行分析,采用哪些分析指标。其中框架确定后还需要确保框架的体系化,体系化即整体分析思路框架的逻辑性。

数据挖掘与数据分析的关系

两者的本质其实是一致的,都是从大量的数据中发现规律,实现自己的目的。
简单来说,数据挖掘是数据分析的进阶。数据分析只是用到统计分析方法,而数据挖掘不仅用到数据分析阶段的数学知识,还需要用到计算机语言进行编程对数据进行处理。
一般来说,数据挖掘侧重于解决四种数据分析问题:分类、聚类、关联和预测

字段、记录、数据类型

字段是事物或现象的某种特征。简单来说,就是数据库中的列,一列为一个字段,对应着spss(统计学)中的变量。
记录是事物或现象的具体表现。简单来说,就是数据库中的一行,一行为一条记录,对应着spss(统计学)中的个案。
数据类型分为数值、文本、日期、货币、时间、分析、百分比等。
总的可以分为字符型、数值型、日期型等大类。日期型属于特殊的数值型数据。

变量尺度

在统计学中,按照对事物描述的精确程度,将采用的测量尺度从地低到高分为四个层次:定类尺度、定序尺度、定距尺度和定比尺度。

定类尺度

是对事物类别或属性的一种测度,如性别、职业。
特点:只能代表事物的类别与属性,不能比较各类别的大小。
SPSS中用“名义”来表示。
分类原则:相互独立、完全穷尽

定序尺度

对事物之间等级或顺序的一种测量,如学历、职级。
特点:只能排序,不能算数计算。
SPSS中用“有序”表示。

定距尺度

对事物次序之间间距的一种测度,如温度、时间
特点:只能加减,不能乘除,可排序,能计算次序之间差距

定比尺度

测算两个测量值之间比值的一种测度。
特点:可加减乘除,如收入、用户量等
定比尺度与定距尺度最大的区别是它有一固定的绝对“0”值。两者在绝大多数统计分析中没有本质的区别,SPSS将他们合并为一类为“标度”。

数据类型与变量尺度

数据类型是数据库用语,变量尺度是统计学用语。
两者的关系可以用下表来表示。

工作簿与工作表

在Excel中,一个sheet为一个工作表,一个Excel为一个工作簿,工作簿中可以有多个工作表。

数据处理

数据处理分为数据清洗数据加工

数据清洗

(spss中【数据】菜单栏)
数据清洗,顾名思义就是把数据洗干净,处理成自己想要的数据。
数据清洗包括:
* 删除重复数据
* 补充缺失数据
* 改正错误数据(包括内容错误和逻辑错误)
删除重复数据:【数据】-【标识重复个案】

数据加工

(spss中【转换】菜单栏)
经过数据清洗过的数据也不一定是我们想要的数据。还需要对数据进行信息提取、计算、分组、转换等,将其变成我们想要的数据表。

数据抽取

字段拆分:【转换】-【计算变量】-函数组-Substr(3),类似于excel中mid函数
随机抽样:【数据】-【选择个案】-【随机个案样本】

数据合并

字段合并:【转换】-【计算变量】-【函数组】-Concat函数
记录合并:【数据】-【合并文件】-【添加个例】

数据分组

可视化分箱:【转换】-【可视化分箱】
重新编码:【转换】-【重新编码为不同变量】

数据标准化

0-1标准化(离差标准化)、Z标准化(标准差标准化)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/353251.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

Python 中的 SOLID 原则

💂 个人网站:【海拥】【摸鱼游戏】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 想寻找共同学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 SOLID 是一组面向对象…

谁说菜鸟不会数据分析(工具篇)

《谁说菜鸟不会数据分析(工具篇)》 基本信息 作者: 张文霖 狄松 林凤琼 出版社:电子工业出版社 ISBN:9787121204098 上架时间:2013-6-14 出版日期:2013 年6月 开本:16开 页码&#x…

谁说菜鸟不会数据分析,不用Python,不用代码,学会这些技能,让你秒变分析大神

作为一个菜鸟,你可能觉得数据分析就是做表格的,或者觉得搞个报表很简单。实际上,当前有规模的公司任何一个岗位如果没有数据分析的思维和能力,都会被淘汰,数据驱动分析是解决日常问题的重点方式。 很多时候&#xff0…

《谁说菜鸟不会数据分析》学习笔记 第一章总览 第二章数据分析思路

网上的信息太琐碎了,根本没搞懂什么是数据分析方法什么是数据分析方法论,所以找了一本比较简单的书来系统学习一下,本来打算粗略看完,但是觉得这本书知识还是不错的,所以决定在未来一周把这本书用心学一下。 这本书是基…

《谁说菜鸟不会数据分析》学习笔记 第八章数据分析报告

第8章 数据分析报告 8.1 什么是数据分析报告 8.1.1 数据分析报告是什么 数据分析报告是用于研究事物的现状、问题原因,并得出结论,提出解决方案的一种应用文体。 是决策者认识事物、了解事物、掌握信息的主要工具之一。 8.1.2 数据分析报告的原则 &…

谁说菜鸟不会数据分析(入门篇)----- 学习笔记4(数据分析方法)

1、数据分析方法 数据分析作用与对应的分析方法 数据分析作用基本方法数据分析方法现状分析对比 对比分析、平均分析、总和评价分析 原因分析细分 分组分析、结构分析、交叉分析、杜邦分析 漏斗图分析、矩阵关联分析、聚类分析 预测分析预测 回归分析、时间序列、决策树、神经网…

《谁说菜鸟不会数据分析》学习笔记 第五章数据分析

第五章 数据分析 5.1 数据分析方法现状分析5.1.1 对比分析法5.1.2 分组分析法5.1.3 结构分析法5.1.4 分布分析法5.1.5 交叉分析法5.1.6 RFM分析法5.1.7 矩阵关联分析法5.1.8 综合评价分析法 原因分析5.1.9 结构分解法5.1.10 因素分解法5.1.11 漏斗图分析法 预测分析5.1.12 趋势…

产品读书《谁说菜鸟不会数据分析(工具篇)》

系列二:谁说菜鸟不会数据分析(工具篇) PPT查看1 、PPT查看2 第一章 : 高效处理数据 查询语法: SELECT 字段1,字段2,字段3 FROM 表 WHERE 条件1 AND 条件2 AND 字段 IN(条件1,条件2,条件3) O…

《谁说菜鸟不会数据分析》之探索性数据分析

探索性数据分析是运用一些分析方法从大量的数据中发现未知且有价值信息的过程。 分类 探索性数据分析可分为以下4种: * RFM分析 * 聚类分析 * 因子分析 * 对应分析 RFM分析 RFM分析是针对销售行为的一种分析方法,在SPSS中有对应的分析模块&#…

产品读书《谁说菜鸟不会数据分析(入门篇)》

PPT查看1 PPT查看2 思维导图下载 ppt下载 什么是数据分析?怎么样才是数据分析的思维?数据分析的流程有哪些?常用的数据方法又有哪些?工具呢?可以学习的网站有哪些?我觉得《谁说菜鸟不会数据分析&#…

谁说菜鸟不会数据分析,不用Python,不用代码也轻松搞定

作为一个菜鸟,你可能觉得数据分析就是做表格的,或者觉得搞个报表很简单。实际上,当前有规模的公司任何一个岗位如果没有数据分析的思维和能力,都会被淘汰,数据驱动分析是解决日常问题的重点方式。 很多时候&#xff0c…

【HTML】第 1 节 - HTML 初体验

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 。 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、HTML 概念 2.1、HTML 定义 2.2、标签语法 3、HTML 基本骨架 4、标签的关系 5、注释 6、总结 1、缘起 最近在学习微信小程…

《谁说菜鸟不会数据分析(入门篇)》总结

一、数据分析方法论 营销方面:4P、用户使用行为、STP理论、SWOT 管理方面的理论模型:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则等 PEST(宏观环境分析)P(political)政治环境(社会性质、执政党性质…

《谁说菜鸟不会数据分析》

一、数据分析概况 (一)、数据分析是“神马”? 1.数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将他们进行汇总、理解并消化, 以求最大化的开发数据的功能 ,发回数据的作用。 2.数据分析…

谁说菜鸟不会数据分析(SPSS篇)----- 学习笔记

SPSS变量尺度跟数据类型百分位值:将数据从小到大排序,用n-1个数据点将数据分成n等份集中趋势:反映数据向其中心值凝聚的程度,对数据一般水平的概括性度量离散趋势:反映数据偏离中心值的程度,是衡量集中趋势…

谁说菜鸟不会数据分析 | 学习笔记 (全)

一.前言 数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出所研究对象的内在规律。在实际工作中,数据分析能够帮助管理者进行判断和决策&…

java SSM 互助旅游管理系统myeclipse开发mysql数据库springMVC模式java编程计算机网页设计

一、源码特点 java SSM 互助旅游管理系统是一套完善的web设计系统(系统采用SSM框架进行设计开发,springspringMVCmybatis),对理解JSP java编程开发语言有帮助,系统具有完整的源代码和数据库,系统主要采…

元宇宙,现状,路径与未来

现在,如果你还不知道元宇宙这个词,那应该直接投诉村村通工程怎么还没修到乡下..…事实上,自从半年前,当已经头发斑白的路边大爷摇在躺椅上一边喝着茶一边问我什么是元宇宙时,我就察觉到元宇宙在各种人士的吹捧下已经火…

Linux 如何查看 隐藏文件大小,某个文件大小,文件夹大小

du -sh dir or file du -sh 后面跟目录或者文件,你要看哪个文件或者文件夹的大小,后面就跟上名字就好,可以写n个。 我截图的后面就是一下看了四个文件夹的大小 命令是简单,记录一下,免得下次用的时候,又…

win11怎么查看隐藏文件

出于隐私等方面的考虑,有些网友给自己的文件做了一些隐藏的处理,但是时间久后就不知道隐藏文件在哪里,该怎么找到win11隐藏文件。那么win11怎么查看隐藏文件?下面小编就教下大家查看win11隐藏文件的方法。 我们需要先取消文件隐藏…