永洪社区

标题: 【专题文章】深度分析介绍 [打印本页]

作者: 张宇航    时间: 2019-8-30 18:25
标题: 【专题文章】深度分析介绍
永洪深度分析集成了复杂的统计算法和机器学习技术,能够从海量数据中,挖掘具有潜在价值的关系、模式和趋势,构建数据模型,做出预测分析。帮助企业及时了解自身问题,发现市场机会,做出科学的经营决策。

1. 深度分析的适用对象有哪些?

   永洪深度分析既适用于不会编程的数据分析师与平民数据科学家,也适用于熟练掌握代码的数据科学家与软件研发人员。永洪深度分析内置多种分析算法,无需脚本,即使是不熟悉 R 语言的用户,也能通过简单的点击拖拽,轻松构建分析模型,快速对数据做出预测分析。
2. 深度分析的经典案例

    1.逻辑回归
     一种用于解决二分或多分类问题的机器学习方法,用于估计某种事物的可能性。例如:某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。逻辑回归可用于客户忠诚度预测、广告点击率评估、信用卡风险评估、财务预警等。
    场景:电信客户流失度预测
    逻辑回归,常用于二元变量的预测,比如有或无、是或否、涨或跌等。从运营商角度,客户状态分为在网和离网,属于典型的二分类变量问题,非常适合应用逻辑回归进行预测分析。
     案例一:例如我们选取 2017 年 2 月至 4 月作为观察窗口,抽取该时间段内5000 个流失客户、5000 个未流失客户,总样本数为 10000,流失客户与非流失客户的比为 1:1。经过与业务人员沟通,得到多个用户行为特征。获得这些样本数据后,首先清洗原始数据记录,包括对数据缺失值和异常值的处理。然后对这些用户消费行为进行相关性分析,剔除具有较高相关性的特征,最终得到 9 个特征,分别为话务量异动、漫游通话费用比例异动、短信量异动、数据流量异动、交往圈人数异动、消费异动、基站数异常、宽带捆绑到期情况、入网时长。根据客户自身消费的这 9 个特征,对逻辑回归模型进行训练。得到的训练结果,再经过测试集对模型的准确性进行测试。应用逻辑回归模型,对客户的状态进行预测,即可得知哪些客户有可能流失。
      当运营商使用了客户流失模型后,就能够有效预测出潜在的流失客户,对有价值的客户进行挽留,加大客户关系维护的投入,进行客户关系的二次开发。
      如上面所提的客户流失的“是”与“否”问题。那么如何利用永洪的深度分析模块实现对客户流失的预测?

1/1. 把原有数据(churn-train)纳入逻辑回归分析模型,构建分类器:


图2中的“数据分区”将会把原有数据churn-Train按照设定的比例分成训练集和验证集,其拟合效果如下:
由图3的ROC曲线可以看到,训练集和验证集的AUC值均大于0.7(值域为0~1),表示拟合效果良好,因此该逻辑回归模型可用。
2. 把新数据(churn-test)纳入已经建立好的逻辑回归模型进行匹配,从而预测客户未来流失情况:
点击图4的“评分“,即可以看到对客户的流失的预测结果:
由图5的预测结果可以看到,逻辑回归分析模型把新客户进行分类预测(流失=1,不流失=0),并给出相应的概率(见“概率”和“类”两个字段)。由此业务人员就可以得知哪些客户可能会流失,并执行相应的挽留策略。

  2. 时序预测
    时序预测:通过时间序列,对某个值进行预测。
    考虑如下场景:通过趋势线,财务人员已经得知往年的成本支出情况,但他更想知道未来一年的成本支出是多少,以便调整成本预算。


由图6的成本趋势统计中,我们可以看到2009-2010年的成本支出情况,那么有没有办法获取2011年的成本支出情况呢?永洪深度分析模块的时序预测算法可满足此需求。通过把时间序列和要预测的字段纳入时序预测分析模型,即可对未来一年的成本支出进行预测:
由此,财务人员可以根据成本预测图,及时调整成本预算。
     3.K-means 聚类
      K-means 聚类是一种得到最广泛使用的聚类算法,常用来进行客户细分,使同一类客户具有较高的相似度,而不同类的客户差异较大             场景:客户细分
案例三:有些客户常购买 A 产品,几乎不买 B 产品,而另一些客户经常购买 B 产品,几乎不买 A 产品。我们就可以根据消费习惯把这些客户分为 A 类客户和 B 类客户,并针对 A 类客户或 B 类客户进行专门的客户维护和营销活动。
     4.关联分析     又称关联挖掘,就是在交易数据、关系数据或其他信息载体中,查找存在于项目集合或对象集合之间的频繁模式、关联、相关性或因果结构。关联分析可用于购物篮分析、商品推荐、定点广告投放、商业选址、用户画像分析等。
    场景:银行营销方案推荐
案例四:关联规则挖掘技术已经被广泛应用在金融行业企业中,它可以成功预测银行客户需求。一旦获得了这些信息,银行就可以改善自身营销。如各银行在自己的ATM机上就捆绑了顾客可能感兴趣的本行产品信息,供使用本行ATM机的用户了解。如果数据库中显示,某个高信用限额的客户更换了地址,这个客户很有可能新近购买了一栋更大的住宅,因此会有可能需要更高信用限额,更高端的新信用卡,或者需要一个住房改善贷款,这些产品都可以通过信用卡账单邮寄给客户。当客户打电话咨询的时候,数据库可以有力地帮助电话销售代表。销售代表的电脑屏幕上可以显示出客户的特点,同时也可以显示出顾客会对什么产品感兴趣。
     以上2个分析提供参考样例,引导大家快速构建分析模型:
通过拖拉拽的方式和简易友好界面,进行参数配置:​
                  作为永洪一站式数据分析平台的重要组成部分,永洪深度分析从 7.5 版本开始,进行了功能模块化升级,实现了流程化操作分析。深度分析作为一个独立的功能模块,拥有全新的操作界面,实现更专业的机器学习功能。通过深度分析的可视化工作流,用户可将数据集拆分为测试集和训练集,选择特征列和目标列,选择分析算法、构建算法模型,对模型进行训练、得出模型参数,利用测试集对模型评分,调整参数/特征、使模型更具准确性,最终应用于数据集和可视化报告,得到预测分析结果。


作者: oscarxu    时间: 2024-2-10 16:05
666
作者: oscarxu    时间: 2024-2-10 16:05
666
作者: oscarxu    时间: 2024-2-10 16:05
666
作者: oscarxu    时间: 2024-2-11 12:27
新年快乐




欢迎光临 永洪社区 (https://club.yonghongtech.com/) Powered by Discuz! X3.4