永洪社区
标题: 数据分析师面临的五大无解难题:深入探索行业内的纠结... [打印本页]
作者: 喝酸奶不舔盖 时间: 2024-4-11 13:44
标题: 数据分析师面临的五大无解难题:深入探索行业内的纠结...
正文开始
又一年的3月,很多同学都在思考职业发展路径问题。最近咨询陈老师的也很多,一个很普遍被问到的,就是:数据分析师的红旗,到底能打多久?今天集中解答一下。还是陈老师的一贯风格,不吹不黑,客观说事。我们一起来看看,面向2021年,数据分析师们最纠结的五个问题:
▌问题一:数据分析会不会被人工智能取代?
答:不会!
首先,看到提“人工智能”四个字的所有标题,大家都能认为是引发焦虑的伪问题。真正懂行的都说:算法、机器学习,或者干脆直插CV,NLP,推荐等某个具体领域。其次,这俩玩意根本就是两件事。算法的发展不仅不会取代数据分析,反而会让数据分析更轻松。
为啥?
因为本质上,算法对抗的是低效率。通过人工标注-模型训练-预测检验的循环,算法可以大量替代以往需要耗费人力的工作。但是算法实现这个目的是有前提的:
第一,需要明确的结果:人工标注的图形、信用违约/未违约记录等等。
第二,需要大量的特征数据,用于训练模型。正是因为如此,我们看到算法应用最成功的就是CV领域。比对人脸、比对证件等就是特征丰富,结果明确。传统的风控、推荐等领域,也有相应进步。NLP领域进展相对较慢,就是被复杂的语境折腾的七荤八素。
本质上,数据分析对抗的是不确定性。当我们想要分析问题的时候,更多是:
● 没有数据:新业务刚上线,过往不重视数据采集
● 有假数据:业务操控,流程缺失,利益驱动
● 乱七八糟:口径不统一,流程不规范,使用瞎胡闹
● 人为扭曲:业务方为了保住KPI睁眼睛说瞎话
● 不会判断:只知道写同比环比,不会解读意义
● 主观臆断:做数据只为证明自己是对的,强词夺理
这种时候,就相当于根本没有标注,或者人工瞎标,模型压根训练不出来。还摸个屁。
正是如此,这才有了数据分析的五大问题:
● 是什么(量化结果,获取数据)
● 是多少(树立标准,评价好坏)
● 为什么(寻找原因,验证假设)
● 会怎样(综合评估,做出取舍)
● 又如何(预测前景,探索可能)