计算层:基于永洪的MPP数据集市及R,通过列式存储、分布式计算、内存计算等方式保障计算性能;
建模层:在做深度分析应用时,会面临着各种数据准备过程,通过“可视化流程式建模”的方式,快速实现数据准备;
算法层:基于建模层准备后的数据,可以作为深度分析的入口,通过逻辑回归、决策树、K-means聚类、关联规则、时序预测、R模型等算法模型,完成深度分析应用。
第一步:按照业务需求,对接数据;
第二步:经“可视化流程式建模”完成数据准备,准备后的数据作为深度分析的入口;
第三步:通过可视化拖拽的方式,选择合适的算法与模型,完成深度分析应用,比如将数据集自动拆分成测试集和训练集,选择特征值、构建算法模型、对模型评分等;
第四步:输出深度分析数据应用结果,应用于可视化分析,指导业务决策等。
自服务数据准备与深度分析结合; 深度分析算法产生的数据结果复用; BI与深度分析深度结合,做联动分析。
图中蓝色的点为每月的实际收入,灰点为模型预报的数值;
从图中可以看到整体趋势在逐年递增,每季度末都会有指标冲高的情况,以年底冲指标尤为明显; 模型也很好地拟合了这些规律; 2016年12月发生了比较大的波动,实际收入明显低于同期水平,可能是受到政策或宏观经济环境的影响。