系列二:谁说菜鸟不会数据分析(工具篇)
PPT查看1 、PPT查看2
第一章 : 高效处理数据
查询语法:
SELECT 字段1,字段2,字段3
FROM 表
WHERE 条件1
AND 条件2
AND 字段 IN('条件1','条件2','条件3')
ORDER BY 字段4
DESC;
注:
- 英文字母大小写均可;
- 符号均为英文状态下的符号;
- 关键字空格分开;
- 字段或参数间逗号分开;
- 参数为字符型用单引号,如:'男'
- 语句结束加分号,如:;
- 表名或字段名中出现空格、“/”、“\”等特殊字符,用[]将表名和字段括起来;
- “*” 代表表格中所有字段;
- 日期和时间类型,在数值两端加“#”
- 尽量避免全表扫描,尽量避免在WHERE中使用“!=”、“<>”、“OR”
工具1:Access
1. 数据导入:
(1)直接导入法:Access数据库中的表与数据源脱离了联系,对数据的更改不会影响源文本数据文件;
(2)建立链接法:链接表显示源文本文件中的数据,但是它实际上并不将数据存储在数据库中,对源文本文件进行的任何更改都将自动反映到链接表中,即数据会随数据源的变化而自动更新。
主键 &索引
索引:相当于对指定的列进行排序,就好比是一本书的目录,通过它可以快速查询到结果,无需全表扫描,加快数据库查询速度。
主键:确定数据中每一条记录的唯一标识,本质是索引,一个特殊索引。主键所在列每一记录都是唯一的,在同一表里只能有一个主键。
区别:
- i: 主键用于标识数据库记录的唯一性,不允许记录重复,且键值不能为空。主键是一个特殊的索引,主键=索引,索引不一定等于主键。
- ii: 索引可提高查询速度,通过它可快速查询到结果,无需全表扫描
- iii: 使用主键,数据库会自动创建主索引,也可在非主键上创建索引,提高查询速度。
- iiii: 数据表中只允许有一个主键,但可有多个索引。
在Access数据库中,主键不是必须的,但为每个表设置一个主键,可提高查询速度
2. 数据处理:
>>>>1. 数据合并
- 横向合并:菜单操作法、SQL查询法【数据库连接关系:INNER JOIN、LEFT JOIN 、RIGHT JOIN 】
- 纵向合并:菜单操作法、SQL查询法【数据库连接关系:UNION ALL、UNION 】
>>>>2. 数据计算
- 简单计算:菜单操作法、SQL查询法
- 函数计算:RUBOOD网站 W3C SCHOOL
>>>>3. 数据分组
- 数值分组:4种方法
IIF(表达式,表达式成立时返回的值,表达式不成立时返回的值)
CHOOSE(参数,结果1,结果2,....,结果N)
SWITCH(条件1.结果1,条件2,结果2,...,条件N,结果N)
PARTITION(数值参数,开始值,结束值,组距)
- 时间/日期分组:
FORMAT(字段名,"yyyy") AS 年
>>>>4. 数据去重
- 查找重复数据:菜单操作法、SQL查询法【FIRST、COUNT、GROUP BY、HAVING】
- 数据去重查询:GROUP BY、DISTINCT、
eg:
select 用户ID from 表 group by 用户ID;
select distinct 用户ID from 表;
3. 数据分析
- 简单统计
- 分组统计
- 交叉表统计:菜单操作法、SQL语句法【TRANSFORM(增加每个行列的交叉点统计函数与字段)、PIVOT(增加作为列标题的分组字段)】
工具2:Microsoft Query
1.数据导入:
建立数据源连接数据,使用“查询向导”选择数据,
2.数据处理:
SQL语句
3.数据分析:
SQL语句分析法、数据透视表法
第二章:玩转数据分析
工具1:PowerPivot
工具2:Excel数据分析工具库
第三章:展示你的数据
第四章:报告自动化
工具1:VBA
工具2:Excel报告自动化
工具3:PPT报告自动化