找文章 / 找答案
精选问答 更多内容

[行业资讯] 数据分析迷茫?掌握这些方法,秒变数据大师!(2)

喝酸奶不舔盖青铜四 显示全部楼层 发表于 2024-2-29 21:33:27 |阅读模式 打印 上一主题 下一主题
4、细分分析原因:细分拆解
通过漏斗分析我们大致可以定位到问题出现在哪个环节,但是,到底是什么这个环节的哪个部分出了问题,我们还需要进一步细分拆解定位问题症结所在。
在数据分析中,细分是数据分析的灵魂,没有细分拆解,就没有数据分析。
小虎期中考试的总成绩不好,细分一看,发现其他科目的成绩都不错,只有数学成绩特别差,只得了 40 分,而且三角函数一题都没有做对。
常见的细分方法有以下 5 种:例如本季度的销售额没有达标,可以按照以下思路进行细分:

(1)按时间细分:哪个时间段的销售额出了问题?
(2)按空间细分:哪个区域的销售额出了问题?
(3)按过程细分:售前导购、购买体验还是售后服务的哪个过程出了问题?
(4)按公式细分:GMV=流量*转化率*客单价,流量、转化率和客单价的哪个部分出了问题?
(5)按模型细分:用户价值分层模型,不同价值的用户的销售额贡献,是哪类用户出了问题?

拆解的方式千千万,在运用细分拆解思维的过程中,要做到有的放矢,围绕数据分析的目标,找到合适的拆解方法,否则只能无头苍蝇一样到处乱撞。
另外,当发现数据异常时,尝试从不同的维度进行细分,这样既能锻炼数据分析思维,又能加深对业务的理解。
企业微信截图_98a44d61-e3a8-4f89-b0d5-f90e7538b42b.png

5、寻找相关因素:相关性分析
如果一个变量改变的时候,另一个变量也朝着相同的方向发生变化,那么我们就说这两个变量之间存在相关性。
分析一家商场的产品销量数据发现,尿布和啤酒的销量会出现大致相同的变化趋势,啤酒和尿布有什么关联呢?采访小虎的爸爸,他说自己下班后,给小虎的弟弟买尿布的同时,也会购买自己喜欢喝的啤酒。
相关性分析,就是寻找变量之间相互关联的程度,相关性一般通过相关系数衡量。最常用的是用于计算线性相关系数的Pearson相关系数,取值区间在1到-1之间。1表示两个变量完全线性相关,-1表示两个变量完全负相关,0表示两个变量不相关。数据越趋近于0表示相关关系越弱。
企业微信截图_3dc87200-f597-46be-b90d-d1e88070a90d.png
用Excel进行简单的相关分析,通常包括以下 3 个步骤:
(1)收集相关数据
(2)绘制散点图形
(3)计算相关系数
需要注意的是,相关性不等于因果性。两个变量之间相关性,并不代表其中一个变量的改变,是由另一个变量的变化导致的。
比如说,分析发现,国家的诺贝尔奖数量,与巧克力消费量之间呈现正相关关系,但这并不是说,多吃巧克力有助于获得更多的诺贝尔奖。一种合理的解释是,诺贝尔奖的数量与巧克力的消费量,很可能都是由其他变量导致的,例如国民的受教育程度和富裕程度。

6、溯源影响因素:归因分析
实际业务中,很多问题的出现并非是单个因素造成的,而是经过多种因素的影响而共同造成的。
所以数据分析最头秃的问题就是:导致问题的原因到底是什么?归因分析(Attribution Analysis)要解决的问题就是多因素影响的情况下,最终效果的提升/下降,应该如何合理地分配给过程中的各个因素。
小虎在手机上看到了朋友圈广告发布了最新的iPhone,午休的时候刷抖音看到了有网红在测评这款手机,下班在地铁上刷朋友圈的时候发现已经有小伙伴收到手机在晒图了,于是喝了一杯江小白壮壮胆回家跟老婆申请经费,最后老婆批准了让他去京东买,有保障。那么请问,朋友圈广告、抖音、好友朋友圈、京东各个渠道对这次成交分别贡献了多少价值?
现实情况往往是很复杂的,在衡量其贡献价值时,只依靠单渠道归因分析得到的结果是不科学的,需要引入多渠道归因分析。常见的多渠道归因分析模型如下:

1、末次归因模型:将功劳100%分配给成交前的最后一个环节
2、首次归因模型:将功劳100%分配给第一个环节
3、线性归因模型:将功劳平均分配给过程中的每个环节
4、时间衰减归因模型:距离最终结果时间越短的环节,可以获得越多的权重
5、位置归因模型:第一次和最后一次环节各贡献40%,中间的所有环节平分剩下的20%贡献
6、自定义模型:根据自身业务的需求,自定义各环节分配比例
企业微信截图_ba0966ad-b0df-4b58-ba54-f7544145cac1.png
没有完美的归因分析模型,任何模型都存在它的局限性和不足,如何有效地结合使用场景和模型特点是用好归因模型的前提。

7、预测变化趋势:预测分析
了解完问题的现状,定位到问题的原因后,我们还需要预测问题接下来的发展趋势。
另一方面,在各行业各领域,只要有核心的业务指标,都要预测核心业绩未来的走势,销售,市场营销,运营,财务等,一方面可以对未来的发展趋势有个大致的掌握,另一方面也可以提前规划,设定各子部门的KPI,以便尽可能地完成或者超过KPI,所以,如何准确地预测核心指标的变化趋势非常重要。
什么是预测?用最简单的术语来说,它是在分析过去和现在的数据,进而预测未来的过程。我们主要根据时间序列数据进行定量预测。我们通过一个案例说明时间序列数据的主要组成。

1.趋势性:趋势是事物发展或变化的总体方向。在上面的例子中,我们看到时间序列呈增长趋势,这意味着在搭乘飞机飞行的乘客数量整体趋势上是在增加。如下图中第一张图所示。

2.季节性:在上述时间序列中可以看到的另一个清晰的模式,就是该变化趋势以固定的时间周期重复,我们称为季节性。在特定时间周期内重复出现或重复的时间序列中任何可预测的变化模式都可以说是季节性。下图中第二张图所示。

3.随机性:去除趋势性和季节性后,剩下的就是一些随机的、无任何规律的白噪声。
时间序列预测的模型有很多,主要归为以下2类:
1、传统预测方法
AR(Auto Regressive Model)自回归模型
MA(Moving Average Model)移动平均模型
ARMA(Auto Regressive and Moving Average Model)自回归移动平均模型
ARIMA(Auto Regressive Integrate Moving Average Model)差分自回归移动平均模型等
2、现代预测方法
基于机器学习方法、深度学习的预测方法。对于机器学习方法,xgboost,随机森林及SVM这些都是可以用的,也没有说哪个模型好用,需要看具体的场景及实验,总之就是看效果说话。
3、用Excel也能做预测
黑猫白猫,能抓住老鼠的就是好猫,不需要复杂的算法和模型,用Excel也能做简单的预测。

企业微信截图_dafb5707-f8dd-4602-9d72-904e6d068653.png

回复

使用道具 举报

高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |《永洪社区协议》
返回顶部