分享到

做数据分析不得不看的书有哪些?

用户分享 2021-9-6 10:54 971人浏览 0人回复
摘要

推荐 2 本:1)《统计学》贾俊平(链接有误,自行搜索贾俊平的统计学即可)广告《统计学(第7版)》学习指导书(21世纪统计学系列教材)作者:贾俊平京东购买2)《统计学 - 学习指导书》贾俊平广告《统计学(第7版) ...

推荐 2 本:

1)《统计学》贾俊平(链接有误,自行搜索贾俊平的统计学即可)

广告

《统计学(第7版)》学习指导书(21世纪统计学系列教材)

作者:贾俊平

京东



2)《统计学 - 学习指导书》贾俊平

广告

《统计学(第7版)》学习指导书(21世纪统计学系列教材)

作者:贾俊平

京东



1. 适合人群

如果你是产品、运营、市场等业务团队,或工作方向是赋能业务经营的,日常工作是看报表、做策略,那么这两本书非常适合你。

如果你是专职的数据分析师,日常工作是做报表、搭中台、跑数据、做模型,那么这两本书不适合你。

简而言之,这两本书是写给做业务的同学,用来提升业务同学的数据分析能力。


2. 推荐理由

理由 1 :贾俊平的《统计学》是市面上为数不多,甚至可以说是唯一一本业务同学可以看懂的统计学教材。

“看懂”有两个层面的意思:1)复杂、繁琐和烦人的公式推导不多,不会出现连着几页纸的推导过程,因为推导过程对于业务同学意义不大;2)其中用很多,甚至是大量的案例来讲解,而这些案例稍加修改就能马上对应到我们产品、运营中遇见的问题,非常有代入感。


理由2:统计学是整个数据科学大厦的基础。没有统计学的基础,即使从事数据分析,可能问题摆在你眼前,你都看不出来;可能你用SQL、Python跑出来了数据,也看不出任何价值点。


理由 3 :我做了11年的数据分析、数据运营,看过的数据分析的书非常多,目前能留下来常看常新的只有以下这些,其中又以统计学为主,而统计学中就只看贾俊平的这本。

因为,过了一遍167个回答,以及题目补充的书,我发现存在这么几个问题:

1)老外写的,不太符合国内的习惯。《精益数据分析》我也看过很多遍,其中一些概念确实很独到,但是回到实际工作场景却很难落地,原因在于老外的工作环境和思维方式和国人仍然存在很大的差异,作为数据分析知识的积累和补充是 ok 的,但是作为“不得不看”却不合适。

2)理论性太强,落地性不高。那些看上去就很牛的书,一般而言,是作者在多年的工作中提炼总结出来的高度概括的内容,具备一定的个人特点,所以并不是普适的。同时,因为是作者总结的,我们在看的时候能理解多少,能应用多少,更需要结合我们自己的实际情况以及经验来判断,不然容易变成纸上谈兵的赵括。

3)技术性太强,IT知识要求过高。凡是SQL、Python、R的书,其实都不是“不得不读”的书,除非工作中必须要用,了解即可,不然学完看完后没有实际场景去用用,亲自写写代码,不出一个星期就忘得精光。同时,这些工具、语言之类的并不是“是个人就能学”,而是有不低的学习门槛。以Python为例,以下关键字是学习前必须理解的:顺序、选择、判断、函数、数据结构、数据类型、数组、变量、面向对象、类、对象、封装、继承、多态、异常、调试、编译等。不然,可能连第一行代码都不知道怎么写。SQL已经是非常业务化的程序语言了,但也需要理解三种表连接的区别、常用的聚合函数、以及最烦人的SQL优化。所以,这类书适合补充和积累,但并不是“不得不看”。

3. 贾俊平的《统计学》应该怎么看

我理了下数据分析需要具备的技能,如下图所示,基本上在贾俊平的《统计学》中都有对应章节详细讲解,下面说说这本书应该怎么看。


按照上图,这本书的内容分为四个部分:发现问题、推断原因、检验效果、预测未来。每个部分都包含 1 个或多个统计学的方法,稍微展开说说:

1)用数据发现问题:描述性统计

描述性统计是所有统计学中最基础的内容,我们熟知的平均数之类就属于此,同时包含了中位数、方差、标准差、异常值等分析方法。它们用来解决或回答如下业务问题:

  • DAU 跌了 5%,正常么?

  • 9 月和 10 月的月均 DAU 一样,那么应该怎么找到突破口?

  • 如何评估 DAU 背后的业务风险?

2)用数据推断原因:相关性分析

事情开始变得有趣,我们此时要找到指标背后的原因了,可是那么多原因,哪些才是最重要的,以及有多重要,就需要相关性分析来定量的分析(注意,不是定性的拍脑袋)。它用来解决或回答如下业务问题:

  • 男性是不是更愿意给 5 星评价?

  • 女性是不是更偏好线上渠道?

  • 不同品类商品的销售额,谁对总体销售贡献最大?

  • 造成 DAU 波动的维度有性别、年龄、机型、粘性,那么谁更重要?

3)用数据验证效果:方差分析、参数估计、假设检验

这三兄弟堪称整本统计学的精华,用来应对更复杂、和海量数据下的业务问题。它们用来解决或回答如下业务问题:

  • 不同获客渠道的用户质量是不是有明显差异?

  • A/B 测试是不是有效果?

  • A/B 实验的最小样本量应该怎么定?

  • 给你 5 分钟,告诉我 11 亿用户的男女性别分布

4)用数据预测未来:趋势预测

我觉得非常有趣和有用的内容,用历史数据来科学、合理的预测未来,在业务上是提前预判风险,提前部署策略,而不是事后的亡羊补牢。它们用来解决或回答如下业务问题:

  • DAU 还会继续下跌吗?

  • 如果继续下跌,会跌到什么程度?

  • 如果止跌反涨,又会涨到什么程度?

  • 我们下季度的重点工作应该做什么?

本文暂无评论,快来抢沙发!

10 文章2 人气
数据分析、数据运营、用户增长
热门问答
  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |联系社区管理员|《永洪社区协议》
返回顶部