前言 数据分析,包括了营销分析、经营分析等。其核心概念就是通过一定的工具、算法,结合业务逻辑将数据背后的真正原因找出来,为企业的发展方向提供数据支撑。 在这个越来越对数据重视的时代,数据分析的价值也在迅速提升。在大型企业的大部分部门中,尤其是前端营销部门中,数据分析工作的好坏可能会直接影响一线的业绩。所以如何做好数据分析,是每一个数据分析师需要思考的问题。一个数据分析师想最终进阶为数据科学家,可能需要经历了好几个阶段,这里有一些各阶段经验的思考,希望对大家有帮助。
阶段一:初入职场的菜鸟分析师在这个阶段中,你只是初入职场的菜鸟,不会特别的技巧也不懂公司的业务,甚至公司IT部开发的前台系统(比如IDAP、QV、自助报表等)中也有很多功能不甚了解。只能根据前人的经验或者公司的培训,才知道该从哪里取数。当清单下载下来后,能够使用的工具也只有Excel,而且只会最简单的数据处理,稍微复杂一点的vlookup、数据透视表、数据有效性等只能靠百度、培训等慢慢提升。
阶段二:部门同事眼中的表哥/表姐经过阶段一的磕磕绊绊后,你对业务已经有一定的理解,知道数据背后的业务逻辑,能够在某一个数字变高或者变低时,通过熟练的Excel操作将产生问题的原因找出来。处于这个阶段的你,在部门内很多员工的眼中,就是一名表哥/表姐,数据需求一提出来,你就能熟练地给出一份完善的报表;有什么Excel的问题,问你比问百度更快获得答案。另外在数据处理的经验上,你也已经有了一定的储备,比如数据字典、数据口径等,出来一项新的业务口径你不看都能猜得八九不离十。近一半的数据分析师可能将一直停留在这个阶段,因为大部分部门的数据量并不大(少于100万),使用Excel加上业务逻辑已经能满足80%的日常工作需求了。
阶段三:开始使用数据库和自动化随着数据量的越来越大,传统的Excel已经无法满足你的工作需求,而DBA(数据库管理员)因为不懂业务逻辑也常常给不出你想要的数据,所以你只能开始自学SQL知识。所幸的是SQL并不难,对于一名数据分析师并不需要像DBA一样对各个表格进行维护,只需要根据业务逻辑,在不同的表中找到需要的字段,通过select、join、count、sum等函数进行组合即可。除了数据库外,也有人可能会想要使用BI工具,使用方法和Excel类似,但是功能强大了不是一点点,本来需要一定开发能力才能完成的自动化报表工作,通过与Excel一样的鼠标拖曳操作即可轻松完成,工作效率上获得了质的提升。在这个阶段的你,可以从繁重的日报、周报中略微透一口气,思考如何通过数据提升业务发展。
阶段四:不是只有平均数平均数是数据分析中用的最多的一个计量尺度,但是姚明和郭敬明的梗用了这么多年,大家也应该理解平均数的问题所在。实际上有很多的计量尺度:中位数、方差、离散程度、偏度、峰度都在不同的场景中可以有很多的运用,而数据分析方法也有方差分析、回归分析、相关系数等等,而这一切的知识集中起来就是一门学科:统计学。来到这一阶段的数据分析高手已经可以将业务知识、统计学知识和工具使用知识三者合一的,这时候才是一名真正合格的数据分析师。
阶段五:向数据科学家进阶 数据挖掘是数据分析的进阶,它还有一个更为人所知的名字:机器学习,人工智能只是机器学习里的一个分支。在这个阶段,你不仅需要从业务的角度去理解数据,还要通过算法来挖掘数据背后隐藏的关系。机器学习的算法非常非常多,平常人终其一生都可能无法学透。好在开源社区的存在将很多算法都封装成库,我们只需要通过程序调用即可享受算法带来的好处。 但是即使如此,建议还是要学习一下算法的原理,只有这样才能更好地选择、运用算法。基础阶段,需要了解、学习的机器学习算法包括:逻辑回归、线性回归、KNN、K-means、决策树、贝叶斯、SVM等等。更关键的是,在这个阶段务必需要掌握一门编程语言,比如Python就是一个很好的选择。
总结上述的五个阶段除了阶段一外,剩下的四个阶段并不完全是顺序关系,有统计学、编程基础的同学只要经过一段时间的业务理解就能直接迈入阶段五。但是还是要重申一点:所有的数据分析都要建立在业务本身,脱离业务的数据分析只是一种数据猜测,风险极大,需要慎重!
|