(, 下载次数: 272)
这篇论文就有80多页,仅后人对他贡献的综述就有10多页,(公众号回复关键词——“沃德教授”获取论文),这位写过巨著《序列分析》的权威教授显然是对框架中A2的特征做过详细而严谨的分析才得出结论滴!
如果拍拍脑袋就能成为统计学家,那大家都是统计学家!
互联网人如何避免“幸存者偏差”?
“幸存者偏差”是数据分析的常见逻辑错误,而数据又是驱动互联网的动力之一,那么互联网人应该在分析数据、决策判断时如何避免“幸存者偏差”的存在呢?卫夕总结了三个步骤:
- 判断样本的随机性,即必须知道样本是否是随机的。
- 判断样本和剩余样本中会不会存在显著差异。
- 分析剩余样本数据,验证结论。
我们来看几个案例直接进行训练:
(1)微信公众号打赏案例
“卫夕聊广告”既开通了公众号也开通了微博账号“卫夕君”,这时候我发现同一篇文章在相同的阅读的情况下微信的打赏特别少,而微博则多一些,因此我起初大致判断微信粉丝的打赏意愿低于微博,直到我想起来微信的iOS用户由于苹果的政策限制目前并不能打赏之后才明白我之前的猜想是错滴,这存在幸存者偏差,于是我尝试在最近的两篇文章末尾专门加上IOS赞赏码,文章的赞赏金额果然提升了接近4倍。
在这个案例中避免幸存者偏差的标准三步为:
- 判断样本的随机性,即看微信公众号的打赏用户是否能代表整体?答案是否定的,因为只覆盖了安卓用户;
- 判断样本和剩余样本会不会存在显著差异?即安卓用户和iOS在打赏这件事上会不会存在差异?答案是:可能存在差异;
- 分析剩余样本数据,验证结论,即加上iOS的打赏码再次验证结果。
(2)视频网站案例
某视频网站在VIP中新上线了一部美剧,该美剧每一集的观看人数之前一直稳定,但当它播到第七集的时候,观看人数有一个相对明显的流失,运营人员开始分析认为是该部美剧从第七集开始剧情急转直下主角忽然挂掉引起的,然而当他们仔细分析流失用户的时候,发现流失的都是因为三个月前某次大规模赠送的免费会员到期引起的,只是时间正好和第七集重合而已,普通会员根本没有流失。
在这个案例中三步分别为:
- 判断样本随机性,即分析流失用户是不是所有会员的随机样本。答案是否定的——流失的都是免费会员;
- 判断样本和剩余样本会不会存在显著差异?即正常会员和免费会员有没有差异?当然有;
- 分析剩余样本数据,验证结论,即看正常会员是否流失。
(3)Facebook视频广告案例
2016年9月年Facebook关于视频广告数据偏差的问题变成了该公司广告历史上不大不小的负面新闻,Facebook在其官方博客中承认:其提交给广告主的数据报告中,视频广告平均播放时长的数字只统计了那些播放时长超过3秒的播放行为,也就是说,如果视频播放没超过3秒,Facebook居然就把它舍去了,很显然,广告主的平均播放时长被拉长了,因为播放时间短的压根不统计,而这一偏差居然存在了长达两年之久。
这个案例中,分析依然分为三步:
判断样本随机性——废话!3秒以下的都舍去了!当然没有随机性!
判断样本和剩余样本是否存在显著差异?废话,3秒以下和3秒以上肯定有差异!
分析剩余样本数据、验证结论。这…..就不用验证了吧!
以上的分析前提是我们需要对我们的业务进行深刻的理解,只有你深刻理解了你业务中具体重要的影响因素你才能做出正确的猜想和判断。
好了:以上就从理论到实践的角度介绍了幸存者偏差,这时候有人会问卫夕,你觉得中文互联网上哪一个平台的内容出现幸存者偏差的概率会比较大?哈哈哈,毫无疑问是知乎!我们来感受一下:
(, 下载次数: 293)
作者:卫夕,微信公众号:卫夕聊广告(ID:weixiads)
欢迎光临 永洪社区 (https://club.yonghongtech.com/) |
Powered by Discuz! X3.4 |