相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。 数据探索相关分析流程如下: 1 拖拽一个数据集和一个相关分析节点到编辑区,连接数据集和相关分析节点 2 通过右侧的”配置项目“页面,进行设置: 【相关系数】相关系数有三种:Pearson,Kendall,Spearman。 •Pearson相关系数(Pearson Correlation Coefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系。 •Kendall系数是n个同类的统计对象按特定属性排序,其他属性通常是乱序的。同序对(concordant pairs)和异序对(discordant pairs)之差与总对数(n*(n-1)/2)的比值。 •Spearman相关系数是衡量分级定序变量之间的相关程度的统计量。 【选择相关列】点击选择按钮打开选择列对话框,从左边拖拽列到右边,添加相关列。
3 配置完成,点击 运行全部,显示以下结果:
|