数据分析师所需的技术与理论
A) 统计学和概率论
统计学和概率论可帮助您正确理解数字、回答一些相关假设并做出更好的预测。例如:
销售旺季的平均销量?
每天售出单量增长幅度是多少?
还有多少潜在客户准备购买的?
多少个咨询客户才能转化成一个下单客户?
购买我们产品的客户占整个市场的百分比是多少?
此外,还可以使用回归和时间序列等统计方法,对未来的预期销售额做出相关预测。
B) 数据库知识
在大数据时代,企业的数据都是存储在数据库中的,因此至少要熟练掌握一个或以上的数据库管理系统。市场上有许多数据库管理系统,如 Oracle、MongoDB、SQLite等。但是最常用的还是MySQL,它是评价最高的开源 DBMS,以其成熟度和可靠性而闻名。但我们如何从数据库中提取所需的数据呢?这正是SQL可以发挥作用的地方,SQL是一种专门设计用于处理大型数据库的结构化语言,检索数据效率非常高。
C) 统计工具
获得数据后,您需要知道至少一种统计工具,并利用这些统计工具对数据进行分析,常见的统计软件包括SPSS、SAS、Sage、Mathematica等。目前,任何人都可以使用Microsoft Excel进行最简单的统计分析,MS Excel 是一种电子表格,可帮助人们分析和绘制数据,它还可以执行大量复杂的数学和统计功能。
D) 编程语言
数据分析师最常用的编程语言是 Python 和 R,原因是今天生成的数据量很大,需要掌握这些编程工具才能更好地开展工作。编程语言提供了两个主要好处。首先,它可以使数据转换变得非常容易。其次,这些语言拥有丰富的库,可以帮助人们轻松地制作预测模型,例如python 中的sklearn 库。
E) 可视化
在21世纪之后,每个行业的数据都可以被可视化,它是决策者和数据分析师了解事情结果的桥梁。目前,市场上最突出的可视化工具包括 – 永洪BI、Tableau 和智分析等,目前的图表可视化正从传统的静态报表逐渐向BI动态报表过渡,可视化能力得到进一步的加强。 |