数据可视化三节课之二:可视化的使用( 三 )


「构成」类的可视化方案 , 重在展现整体里的构成比例 , 最简单的「构成」例子非饼图莫属 。 或许有同学会问 , 饼图也展现了不同部分的大小比例 , 是不是也可以和柱状图一样 , 作为「比较」类的可视化方案呢?
理论上可以 , 但屠夫不建议这么做 。 人眼对于面积和角度的感知敏感性远低于长度 , 而饼图恰恰是运用面积和角度进行可视化表达 , 在「比较」方面不够显著 。
举个例子 , 下面3种情形属于“比较对象的数值接近” , 我们从上面饼图里获得的对比效果 , 远不及下面的柱状图—— 虽然上下两张图 , 是基于相同数据绘制的 。
数据可视化三节课之二:可视化的使用文章插图
来源:图之典
实际分析里我们也会遇上“带层级结构的数据” , 这时我们需要饼图的加强版 —— 旭日图 。 旭日图又叫“多层饼图” , 以同心圆的多层来表示层级关系 , 内层是外层的“父” , 本质上也是一种树状结构 。
比如下面这张图展示了不同咖啡风味的层级关系:
数据可视化三节课之二:可视化的使用文章插图
来源:jasondavies.com
较真的同学会发现 , 饼图运用了圆的“圆心角” , 旭日图以此为基础套上“同心圆” , 却没有发挥“半径” 。 如果把圆的半径也用于数据表达 , 就会形成南丁格尔玫瑰图 。 顾名思义 , 这是由著名的医疗改革家南丁格尔护士发明的一种图表 , 用扇形的半径来表达数据 。
下面的例子是Facebook在2016年的用户画像 , 每一块扇形表示一种数据维度 , 而人口统计学属性 (性别、收入、年龄、学历) 还使用了层叠:
数据可视化三节课之二:可视化的使用文章插图
来源:excelhowto.com
六、Trend · 趋势第五大类是T · Trend , 趋势 。
「趋势」类的可视化方案 , 重在描述数据随某一维度变化而变化的情况 。 “某一维度”往往是「时间」 , 这样的图表就是我们经常见到的折线图了:
数据可视化三节课之二:可视化的使用文章插图
来源:澎湃新闻
注意了 , 屠夫只是说“往往是「时间」” , 总会有例外 。 如果“某一维度”是「流程节点」 , 那么可以用桑基图来表达:
数据可视化三节课之二:可视化的使用文章插图
来源:经济学人
上图是经济学人对“难民流向”问题的可视化 , 其中蓝色表示难民来源国家 , 黄色表示迁移目的地 , 绿色表示成功入境 , 红色表示拒绝入境 。
桑基图在互联网行业常用于用户路径分析 , 每一个节点可以表示一个功能页面 , 而节点间的条状带表示有多少用户沿着这个方向跳转或流动—— 这 , 也是一种“趋势” 。
把桑基图顺时针旋转90度 , 再挑选其中一种路径进行展示 , 就成了另一种图表 —— 漏斗图 。 依然是来自经济学人的可视化案例 , 这次是有关职场性别歧视 (薪资差距) 的分析 , 对比同类型工作中男女薪资差异 。
漏斗从上至下分别是:

  • 所有工作
  • 同级别的工作
  • 同级别且同公司的工作
  • 同级别、同公司且同部门的工作

数据可视化三节课之二:可视化的使用文章插图
来源:经济学人
七、可视化方案5大类的总结无论是在分析过程中辅助推理 , 还是在分析结果上辅助表达 , 选取合适的可视化方案十分重要 。
让我们重新回顾一下5大类可视化方案及其作用吧~
【Distribution · 分布】 展现数据的分布情况 , 是洞察的基础【Relationship · 关系】 表达数据之间的关系 , 突出的是关联【Comparison · 比较】 对比数据的不同表现 , 重点的是差异【Composition · 构成】 呈现数据内部的成分 , 关注的是比例【Trend · 趋势】 考虑数据随时间、流程等维度变化的情况在第二节课的最后 , 屠夫整理了一些常见图表的可视化功能 , 大家不妨保存下来随手查询哦~


推荐阅读