数据可视化三节课之二:可视化的使用( 三 )
「构成」类的可视化方案 , 重在展现整体里的构成比例 , 最简单的「构成」例子非饼图莫属 。 或许有同学会问 , 饼图也展现了不同部分的大小比例 , 是不是也可以和柱状图一样 , 作为「比较」类的可视化方案呢?
理论上可以 , 但屠夫不建议这么做 。 人眼对于面积和角度的感知敏感性远低于长度 , 而饼图恰恰是运用面积和角度进行可视化表达 , 在「比较」方面不够显著 。
举个例子 , 下面3种情形属于“比较对象的数值接近” , 我们从上面饼图里获得的对比效果 , 远不及下面的柱状图—— 虽然上下两张图 , 是基于相同数据绘制的 。
文章插图
来源:图之典
实际分析里我们也会遇上“带层级结构的数据” , 这时我们需要饼图的加强版 —— 旭日图 。 旭日图又叫“多层饼图” , 以同心圆的多层来表示层级关系 , 内层是外层的“父” , 本质上也是一种树状结构 。
比如下面这张图展示了不同咖啡风味的层级关系:
文章插图
来源:jasondavies.com
较真的同学会发现 , 饼图运用了圆的“圆心角” , 旭日图以此为基础套上“同心圆” , 却没有发挥“半径” 。 如果把圆的半径也用于数据表达 , 就会形成南丁格尔玫瑰图 。 顾名思义 , 这是由著名的医疗改革家南丁格尔护士发明的一种图表 , 用扇形的半径来表达数据 。
下面的例子是Facebook在2016年的用户画像 , 每一块扇形表示一种数据维度 , 而人口统计学属性 (性别、收入、年龄、学历) 还使用了层叠:
文章插图
来源:excelhowto.com
六、Trend · 趋势第五大类是T · Trend , 趋势 。
「趋势」类的可视化方案 , 重在描述数据随某一维度变化而变化的情况 。 “某一维度”往往是「时间」 , 这样的图表就是我们经常见到的折线图了:
文章插图
来源:澎湃新闻
注意了 , 屠夫只是说“往往是「时间」” , 总会有例外 。 如果“某一维度”是「流程节点」 , 那么可以用桑基图来表达:
文章插图
来源:经济学人
上图是经济学人对“难民流向”问题的可视化 , 其中蓝色表示难民来源国家 , 黄色表示迁移目的地 , 绿色表示成功入境 , 红色表示拒绝入境 。
桑基图在互联网行业常用于用户路径分析 , 每一个节点可以表示一个功能页面 , 而节点间的条状带表示有多少用户沿着这个方向跳转或流动—— 这 , 也是一种“趋势” 。
把桑基图顺时针旋转90度 , 再挑选其中一种路径进行展示 , 就成了另一种图表 —— 漏斗图 。 依然是来自经济学人的可视化案例 , 这次是有关职场性别歧视 (薪资差距) 的分析 , 对比同类型工作中男女薪资差异 。
漏斗从上至下分别是:
- 所有工作
- 同级别的工作
- 同级别且同公司的工作
- 同级别、同公司且同部门的工作
文章插图来源:经济学人
七、可视化方案5大类的总结无论是在分析过程中辅助推理 , 还是在分析结果上辅助表达 , 选取合适的可视化方案十分重要 。
让我们重新回顾一下5大类可视化方案及其作用吧~
【Distribution · 分布】 展现数据的分布情况 , 是洞察的基础【Relationship · 关系】 表达数据之间的关系 , 突出的是关联【Comparison · 比较】 对比数据的不同表现 , 重点的是差异【Composition · 构成】 呈现数据内部的成分 , 关注的是比例【Trend · 趋势】 考虑数据随时间、流程等维度变化的情况在第二节课的最后 , 屠夫整理了一些常见图表的可视化功能 , 大家不妨保存下来随手查询哦~
推荐阅读
- 西部数据在CES 2021推出多款4TB容量的旗舰级SSD
- WhatsApp收集用户数据新政惹众怒,“删除WhatsApp”在土耳其上热搜
- 未来想进入AI领域,该学习Python还是Java大数据开发
- 黑客窃取250万个人数据 意大利运营商提醒用户尽快更换SIM卡
- 阳狮报告:4成受访者认为自己的数据比免费服务更有价值
- 中消协点名大数据网络杀熟 反对利用消费者个人数据画像
- 学习大数据是否需要学习JavaEE
- 意大利运营商Ho Mobile被曝数据泄露
- 微软官方数据恢复工具即将更新:更易于上手 优化恢复性能
- HDMI 2.1诞生三年:超高速数据线落地 8K电视圆满了
