数据可视化,即通过图表形式展现数据,帮助我们快速、准确理解信息。好的可视化会“讲故事”,能向我们揭示数据背后的规律。
本文主要介绍常见图表的信息表达特征和适用场景,帮助大家了解如何在不同的场景下选择合适的图表,从而帮助我们更清晰的传递信息。(注:正文中所有图表的制作所使用的工具为Yonghong Z-Suite)
图1:图表类型
图表基础元素
一张图表至少包含:标题、横纵坐标轴、数据系列、数据标签、图例等部分,每一部分都在图表中扮演特定的角色、表达特定的信息。
图2:图表的基本元素
可视化图表的两个概念1. 维度(Dimension) 如地区、性别、职业等,常常是观察数据的角度,往往是横坐标。特征为类别型字段、一般是离散的、不可进行四则运算。
2. 度量/指标(Measure) 如UV、PV、客单价、活跃用户数,数据的统计值衡量,往往是纵坐标。特征为数值型字段、一般是连续的、可进行四则运算
可视化图表类型详解
1. 折线图“家族”
折线图作为信息最明了的图表,是各种图表中最容易解读的图表,以下是它的几种变种:
例如图3所表示的是:某公司4.01-5.20日期间新增用户数的变化趋势,其中标记了两个运营的重要事件,分别是“应用市场投放开始”和“应用市场投放停止”。从折线图中我们可以发现,新增用户在应用市场投放后增长明显提升,并且带动了停止投放后的自然新增。
图3:基础折线图
面积大小对应该类别数值大小,反映不同类别占比关系及其时间趋势变化。
以图4为例,颜色代表不同渠道,面积的大小来表示新增用户,以时间来展示趋势变化。从图4中可看出AppStore和360手机助手为该产品下载量Top1、2的渠道。然而它的缺点是:由色块面积来表示数值大小不够直观。
图4:堆积面积图
2. 柱形图“家族”
累加柱形图的核心思想是“对比”,适合少量类别的对比,且对比信息特别清晰。
例如图5表示的是某公司在调整运营策略前后的成本对比,经过对比后发现,唤回成本有所提高,拉新成本有所降低。假设该公司的运营策略为侧重唤回,减少拉新,通过这张图就可以发现执行是到位的。
图5:累加柱形图
与堆积面积图相比,堆积面积图比累加柱形图多一时间维度,它可表达时间维度上的趋势变化。
主要运用于多个指标进行对比分析的场景,但类别对象不宜过多,当超过5个,不适合使用此图表。
图6是某医院的科室患者和医生人数对比图。从图中可以发现在所有科室中,内科医生为医生数最多的一个科室,而儿科中的患者数是最多的,说明每个医生需要服务到更多的患者。
图6:多指标柱形图
单一指标柱形图,必须按照数值大小降序排列,从而提升条形图的阅读体验。当对比对象类别>5时,将多指标柱形图更改为单指标的条形图,能有效提高数据对比清晰度。
图7:单一指标柱形图
瀑布图的核心是按维度/指标下钻分解,如公司收入各用途分解、公司年利润按分公司分解、业绩按销售团队分解等。
例如图8为某公司去年收入成本的分解,从图中可以看到花费最多的为仓储费用,以此来判断是否有需要降低的费用,从而来提升净利润。
图8:瀑布图
背离式条形图比单一指标条形图的优势在于:多增加了一个对比维度以及双尾关注(正数第一、倒数第一)。当数据指标有正负对比、前后对比、左右对比概念时候,可以选择背离式柱形图。如:进出口贸易值对比、某业务的前后变化对比、人为构建的均值差异等。
图9:背离式条形图 柱形图结合折线图,通过对比多个指标,使得一个图表可以表现两个层次的信息。
图10:柱形图结合折线图
3. 散点图“家族”
散点图适合用于发现变量间的关系与规律。
用于观察两个指标的关系。
图11:基础散点图 在基础散点图上添加一个指标:用气泡大小来表示。
例如图12中,气泡大小表示在职时间。从图中可以看出,当人均接待数>7的时候,在职时间长的员工2分钟内的回复率较高。
图12:气泡图
在基础散点图上添加一个维度:用颜色来区分。
例如图13中的科室是我们要观察的维度,如果公司要重点运营某些科室,可能会选择右上角区域内的科室。
图13:基于散点图的分类矩阵
根据散点图的分类矩阵,可以实现分类运营。分类运营是精准运营的开始,比如常见的活跃/不活跃/平民客户/高端客户等用户分类指标。
4. 饼图“家族”
例如图14中,面积代表占比大小。饼图需要标注具体数值,如果没有具体数值的标注,是很难看出分公司D和分公司E占比大小差异的。
图14:基础饼图
技巧:将需要突出显示的部分,置于左上角、顺时针方向。
环状图是由两个及两个以上大小不一的饼图叠在一起,挖去中间的部分所构成的图形,与饼图本质上没有任何差别。
图15:环状图
饼图小结:
1)一般来说,数值最大的部分排在最前面,也就是12点钟方向顺时针;2)饼图的细分项不宜过多,一般不超过8项; 3)不要制作三维的饼图,不直观; 4)切忌将饼图拉得过开,若要突出某一块,可单独将其拉开。
5. 其他图表
雷达图可以直观地呈现几个观察对象在多个指标上对比情况,但需要保证雷达图的指标代表正负倾向一致。需要注意的是:雷达图的线条不超过5条,衡量指标不要超过8个。
例如图16中可以看出,最优秀的为客服A,客服B的主要问题在于质检得分低,客服C的比较平庸,客服D的评估、比例的值很好,但是绝对值不高,他可能为一个很值得培养的新员工。
图16:雷达图
漏斗图适用于关键业务环节数据比较,将各环节串联起来构成漏斗,量化流程内环节,追踪各环节转化率。
图17:漏斗图
地理图是将数据信息在地理区域上的分解,是空间分布的一个良好展示。
例如图18为某公司平台用户在全国省份的分布情况,颜色越深代表该省份用户越多。
图18:地理图
箱线图又称盒须图,是一种显示数据分布情况的统计图,从中可以观察到数据的分布是否密集、是否具有偏向性、是否存在异常值。
图19:箱线图
词云图是为了描述事物的主要特征,要求能够让人一眼看出一个事物的主要特征,越明显的特征越要突出显示。
例如图20中,Word直接展示对象,Word字体大小表示某种度度量。字体越大,表示出现次数越多。
图20:词云图
树形图主要用于可视化层次和整体与部分的关系。以区块表示部分与层级,不同区块用颜色区分,用矩形面积表示大小关系。
图21为某家公司用户访问APP中广告位访问的用户访问量的对比,从中我们可以发现,做了UTD活动的访问量是最大的。
图21:树形图
|