分享到

小图表大用途,帕累托图、盒须图、桑基图可以这样用

经验 2025-3-6 10:24 20人浏览 1人回复
摘要

在商业分析中,图表是数据最直观、最生动的表达方式。它们能够将复杂的数据集转化为易于理解和记忆的信息,帮助决策者快速捕捉关键信息,洞察市场趋势。然而,面对琳琅满目的图表类型,我们常常不知道该如何选择合适 ...


在商业分析中,图表是数据最直观、最生动的表达方式。它们能够将复杂的数据集转化为易于理解和记忆的信息,帮助决策者快速捕捉关键信息,洞察市场趋势。然而,面对琳琅满目的图表类型,我们常常不知道该如何选择合适的图表来呈现特定数据。面对千篇一律的柱状图、折线图和饼图等,我们还有什么其他选择?今天,我们将聚焦那些不常用但极具价值的图表,并探讨它们在实际工作中的应用场景。



帕累托图:聚焦关键问题




帕累托图,以意大利经济学家维尔弗雷多·帕累托的名字命名,是一种结合了条形图和累积百分比曲线的复合图表。它通过将数据按照重要性或影响度排序,并计算累计百分比,从而直观地展示“少数关键因素导致大部分问题”的二八法则。帕累托图的核心在于帮助分析者快速识别出影响最大的几个因素,从而集中资源解决关键问题。这一图表基于“二八定律”,即约80%的问题源于20%的主要原因。


使用方法


帕累托图只能绑定一个度量字段,绑定后默认生成两列度量列,新生成的附属列名固定为“累计百分比”。绑定后会一同绘制线图、柱图,并生成以累计百分比为目标轴、值为80%的目标线,类似组合图。二八分析线可以更直观的表达出是在哪些条件作用下对结果产生了80%的影响。


使用场景


  • 质量管理:在制造业中,帕累托图可以帮助识别导致产品缺陷的主要原因,从而优先解决这些问题,提高产品质量。
  • 生产优化:在生产工程中,通过分析生产线上的各个环节,找出制约生产效率的瓶颈因素,优化生产流程。
  • 市场营销:通过分析客户购买数据,识别出最受客户欢迎的产品或服务,制定更有针对性的营销策略。
  • 成本控制:在企业管理中,识别出成本消耗最大的业务领域或产品,以便进行资源重新分配或业务调整。


雷达图:多维度比较


雷达图(Radar Chart),也称为网络图、蜘蛛图、星图、蜘蛛网图、极坐标图或Kiviat图,是一种从同一点开始的轴上表示三个或更多个定量变量的二维图表。每个轴代表一个变量,轴上的刻度表示变量的度量值,它通过将数据点在二维平面上进行连接,形成类似于蜘蛛网的图案,从而直观地展示数据的分布特征和变量之间的关系。


使用方法


雷达图可只绑定度量,也可在轴上绑定维度来展示度量数据。轴上只绑定度量时,会根据度量数进行等分,来对多个度量进行比较。



轴上既绑定了度量,又绑定了维度,会根据维度数进行等分,逆时针分布所有的维度。

使用场景


  • 企业经营分析:雷达图可应用于企业经营状况的评价,包括收益性、生产性、流动性、安全性和成长性的多维度分析。通过将企业实际经营情况与行业标准进行对比,可以清晰地展示企业的优势和劣势,为决策提供有力支持。
  • 财务分析:在财务分析中,雷达图可用于展示公司的财务状况,如收入、支出、现金流等多个财务指标。通过雷达图,管理者可以直观地了解公司的整体财务状况,及时发现问题并采取措施。
  • 市场调研:在市场调研中,雷达图可用于展示消费者对产品的偏好、满意度等多个维度的数据。通过对比不同产品或服务在各项指标上的表现,企业可以明确市场定位,优化产品和服务。


盒须图:数据分布的快速概览


盒须图(Box-and-Whisker Plot),又称箱型图或盒式图,是一种用于展示数据分散情况的统计图形。它通过几个关键统计量来概括数据的分布情况,包括下须下枢纽(Q1)中位数(Q2)上枢纽(Q3)上须以及异常值。由于图形形状像箱子,故得名箱型图。盒须图主要用于反映原始数据的分布特征,并能有效地进行多组数据分布特征的比较。

使用方法


创建盒须图,通常需要先将度量字段绑定到列轴或行轴上,然后将维度字段绑定到分组或者标记组中。

盒须图中有几个数值需要关注:

  1. 异常值:不被包含在盒须图的主体部分(即盒子和须)内,而是单独标出,一般用点表示。在数据分析中,可以直观地识别出异常值,进而决定是保留、删除还是进行其他处理。如图所示,异常值为42364。
  2. 上须:上须通常表示数据的最大值。它提供了数据分布上限的直观表示,有助于识别超出正常范围的数据点。同时,它也反映了数据分布的右偏斜程度。如图所示,上须为44001。
  3. 下须:下须通常表示数据的最小值。它提供了数据分布下限的直观表示,有助于识别低于正常范围的数据点。同时,它也反映了数据分布的左偏斜程度。如图所示,下须为9941。
  4. 上枢纽:为一组数据从小到大排列后,位于75%位置的数据点。它表示有75%的数据小于或等于这个值,25%的数据大于这个值。它有助于了解数据的分布情况,特别是在分析数据分布范围和形态时。如图所示,上枢纽为32684。
  5. 下枢纽:为一组数据从小到大排列后,位于25%位置的数据点。它表示有25%的数据小于或等于这个值,75%的数据大于这个值。它有助于了解数据的分布情况,特别是在数据偏斜或存在多个峰值时。如图所示,下枢纽为11495。
  • 中位数:中位数是数据分布的中心位置,它对于描述数据的中心趋势非常有用,特别是在数据存在偏斜或极端值的情况下,中位数比平均数更能代表数据的中心位置。如图所示,中位数为12717。

使用场景

  • 品质管理:快速识别生产过程中的异常值,监控产品质量的稳定性。
  • 金融分析:比较不同投资组合的风险与收益分布。
  • 市场调研:分析不同消费者群体的购买行为差异。
  • 医疗健康:监测患者的某项指标变化趋势,识别异常波动。


桑基图:解释复杂流程


桑基图(Sankey diagram),又称桑基能量分流图或桑基能量平衡图,是一种基于流量的可视化图表,用于展示复杂的数据流向和交互关系。它由瑞士工程师Matthew Henry Phineas Riall Sankey于1898年首次提出,并以他的名字命名。桑基图通过延伸的分支和线条的粗细来代表数据流量的方向和大小,具有直观、简洁的特点,非常适合于展示能源、材料成分、金融、人口流动等多种类型的数据。


使用方法

您可以将想要展示的流出的维度、流入的维度和度量字段绑定到数据绑定区域相应的位置。


使用场景


  • 能源消耗与产出:展示不同能源来源之间的关系以及能源的消耗与产出情况,帮助评估能源效率和可持续性。
  • 产品供应链:跟踪原材料的来源、制造过程中的变化和消耗,以及最终产品的分发和销售情况,揭示供应链中的瓶颈和改进潜力。
  • 人口流动:展示人口在不同地区和群体之间的流动情况,对城市规划、社会科学研究和人口统计分析具有重要意义。
  • 网站流量分析:展示网站的访问流量和用户行为路径,帮助优化网站设计和内容布局,提升用户体验和转化率。


帕累托图、雷达图、盒须图、桑基图等这些不常用的图表工具,以其独特的视角和强大的分析能力,为我们提供了宝贵的洞见。它们不仅仅是数据的简单可视化,更是洞察市场趋势、优化业务流程、提升决策效率的关键工具。因此,作为数据分析师,我们应该不断探索和尝试新的图表工具,以更加全面和深入的视角去审视数据,挖掘其中的潜在价值。同时,我们也要注重将这些工具与具体的业务场景相结合,用数据说话,用图表展示,为企业的战略规划和业务决策提供更加有力的支持。



评论
20人参与,1条评论

精彩评论

查看全部评论>>

150 文章933 人气
数据分析
热门问答
  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
100W

用户等你来哦

Copyright   ©2012-2025  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |《永洪社区协议》
返回顶部