永洪社区
标题:
数据分析(1):三观的建立
[打印本页]
作者:
弱弱说他在学习
时间:
2018-1-12 14:56
标题:
数据分析(1):三观的建立
(, 下载次数: 259)
上传
点击文件名下载附件
一、数据分析的概念
数据分析大致可以分为三个层次(这边沿用苏格兰折耳喵的部分观点):
1)描述性数据分析
如果没有系统学习过数据分析的一般处于这个阶段,常用的方式:对比分析、平均分析、交叉分析等。
2)诊断性数据分析
从这个阶段开始,才刚刚进入真正的数据分析阶段。这个阶段可以运用一些数据分析的方法论来对数据进行解释。如AARRR模型,PEST模型、5W2H、逻辑树、用户行为理论等。
3)预测性数据分析
运用机器学习等方法建立模型,预测数据。
不同的人有不同的分类方法,但是万变不离其宗。
数据分析的一般步骤是:
获取数据、处理数据(抽样、清洗等)、数据结果(数据处理后得到的一些统计量,我们平常用到留存率、活跃度等等都是)、分析原因(分析数据变化的原因,如可能是活动带来了活跃度的提升)、预测(提供决策参考)。
二、数据的来源
要进行数据分析,首先得要有数据。数据可以分为内部数据以及外部数据。又可以分为一手数据和二手数据。内部数据和外部数据容易理解,内部数据即自己掌握的数据,如埋点数据等。外部数据包括结构化的如三方应用市场的下载数据到非结构化的评论数据。一手数据主要指的是可以直接获得的数据,如埋点产生的数据就属于一手数据。二手数据指的是经过加工的数据,如数据分析师给出的数据,以及各种媒体给出的数据。
那么数据的来源有哪些呢?
1)数据库
一般可以从公司内部的数据库中获取想要的数据。如果没有可以提出数据收集的需求。
2)公开出版物
国家统计网站、《中国统计年鉴》等。
3)数据平台
cnzz统计、友盟等统计工具,基于自身产品是否有接入。
4)自建数据平台:
大厂一般都有自己的数据平台。另外也有一些开源的数据平台可以免费使用,如airbnb的superset。
5)爬虫抓取:
这是最常见的一种方式,需要一定的编程基础。不过现在也出现了一些采集器,如GooSeeker很大程度降低了门槛。
6)市场调研:
自己动手丰衣足食,大学时候做论文没少做过问卷调查,这里方法不再赘述。
三、数据分析的三观
1)分析目的要明确:
数据分析一定要围绕着目的进行,而不是单纯的摆数据。
2)掌握一定的数据分析手法,但是不要沉迷于手法:
数据分析的手法有很多,基础的一定要掌握,如对比分析、分组分析、交叉分析、结构分析、漏斗图、因素分析、矩阵关联。而高阶的数据分析手法如逻辑回归、主成分分析、因子分析等,一般作为产品经理(非数据方向),用到的会比较少。所以可以做了解,有兴趣的可以深入钻研。但是要明白一点并不是手法越高级分析越准确,合适的方式才是最准确的。不要过分沉迷于高级手法,以分析目的为导向。
3)数据分析要结合业务:
产品经理相对于数据分析师的优势就是更懂业务。懂业务有什么好处呢?可以很轻易的理解数据分析师可能理解不了的一些数据的关联性。如著名的“啤酒”与“尿布”的案例。结合业务进行数据分析,才能更好理解数据背后的真相。
四、数据分析的工具
数据分析的工具没有孰好孰坏,适合自己的就是最好的。介绍一下我们常用的数据分析工具:
1)Excel:
我们最熟悉的Excel是一款出色的数据分析工具,虽然大多数人只是把它当成表格。基本上已经够用了!但是毕竟不是为统计而生的软件,如果常使用高级分析手法的人会觉得不顺手,因为一些计算没有被封装好,还得自己写。不如直接用专用的统计工具。
2)SPSS:
毫无疑问,说道统计工具无人不知SPSS,统计必备,提供了很多分析方法。
3)Python:
Python明显和上面不是一个类别的玩意儿,为什么我把它列出来是因为预测型的数据分析离不开机器学习,说道机器学习就不得不提python,至于为什么是python不是本篇重点,有兴趣可以自行查找相关材料。python主要推荐anaconda,它解决了各种数据科学的依赖包,对于不熟悉python的人简直就是福音。
4)R:
R就是为统计而生的语言。专业性较强,适合统计学背景的大神使用。
5)其他:
JMP、SAS、XLstat等等。有兴趣可以自行查找资料。
本文作者:跹尘
欢迎光临 永洪社区 (https://club.yonghongtech.com/)
Powered by Discuz! X3.4