1.逻辑回归
一种用于解决二分或多分类问题的机器学习方法,用于估计某种事物的可能性。例如:某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。逻辑回归可用于客户忠诚度预测、广告点击率评估、信用卡风险评估、财务预警等。
场景:电信客户流失度预测
逻辑回归,常用于二元变量的预测,比如有或无、是或否、涨或跌等。从运营商角度,客户状态分为在网和离网,属于典型的二分类变量问题,非常适合应用逻辑回归进行预测分析。
案例一:例如我们选取 2017 年 2 月至 4 月作为观察窗口,抽取该时间段内5000 个流失客户、5000 个未流失客户,总样本数为 10000,流失客户与非流失客户的比为 1:1。经过与业务人员沟通,得到多个用户行为特征。获得这些样本数据后,首先清洗原始数据记录,包括对数据缺失值和异常值的处理。然后对这些用户消费行为进行相关性分析,剔除具有较高相关性的特征,最终得到 9 个特征,分别为话务量异动、漫游通话费用比例异动、短信量异动、数据流量异动、交往圈人数异动、消费异动、基站数异常、宽带捆绑到期情况、入网时长。根据客户自身消费的这 9 个特征,对逻辑回归模型进行训练。得到的训练结果,再经过测试集对模型的准确性进行测试。应用逻辑回归模型,对客户的状态进行预测,即可得知哪些客户有可能流失。
当运营商使用了客户流失模型后,就能够有效预测出潜在的流失客户,对有价值的客户进行挽留,加大客户关系维护的投入,进行客户关系的二次开发。
如上面所提的客户流失的“是”与“否”问题。那么如何利用永洪的深度分析模块实现对客户流失的预测?
1/1. 把原有数据(churn-train)纳入逻辑回归分析模型,构建分类器:
|
|