说到图表,大多数人脑子里都会浮现出 Excel 图表里的六大不老男神:柱状图、条形图、折线图、饼图、散点图、雷达图。 虽然图表界不断有小鲜肉冒出,比如树状图、箱线图等,但这六大基础图表的地位一直未被撼动。 要想做好数据可视化,首先要对基本图表足够熟悉!本系列文章将对数据可视化过程中所用到的基础图表和流行图表展开详细梳理,以帮助大家更好地使用图表进行数据可视化,第一篇我们先从柱状图和折线图说起。 (为了让大家有更直观的感受,基础图表篇系列文章里的图表基本都是借助 Excel 生成。)
下面分别是我用自己数据生成的查看手机次数的柱状图和今日头条后台提供的某篇文章传播数据的柱状图。 ▲小数同学每天查看手机的次数 ▲某文章在今日头条后台的统计数据 结合官方解释,我们关注三个主要信息点: 1.柱状图适用于小数据集分析。如果我们就任性地想把它应用到大数据集中,会发生什么呢?(此时肯定不能用 Excel 验证我们的想法了,因为 Excel 最多支持 255 个数据系列)我将某电商平台的商品发货数据导入 DataHunter 的后台进行试验:”商品编号”作为维度,“商品发货件数”作为度量,总共 1000 条数据,生成柱状图如下: ▲DataHunter 后台生成的发货件数柱状图 现在可以明显的看出柱状图在处理大数据集时的劣势:很难对每个商品做明确区分,多种商品挤在一起,无法区分出商品之间的发货量对比。(PS.上边的错误操作,请勿模仿哦~) 2.二维图表:只能有一个变量,但可以比较多个值。 还是以上面小数同学查看手机次数的数据为例,针对“周”这个单一时间变量,我们把小猎同学的数据作为另一个值也引进来,就可以对同一时间内两个人查看手机的次数进行比较。 通过下图很明显看到,每个工作日小猎的手机查看次数要多于小数,周末则反之。 ▲小数和小猎一周内查看手机次数对比 3.柱形图横过来,就变成了我们习惯的条形图。他俩的用法大致相同但又有些微差异:柱状图通常用来呈现变量的分布,而条形图经常用来比较变量;柱状图将数据按照一定的区间分组,而条形图将数据分类。 放个条形图的例子大家感受下: ▲HR眼中,毕业生缺乏的素质占比 在对柱状图有了大致了解后,下面介绍如何给它做基本的可视化处理,主要从三个方面考虑:
我们仍然以小数同学查看手机次数的数据为基础,按以上三个要点操作:通过选取 DataHunter 的 logo 色给工作日和休息日的数据系列分别着色;引入手机的 icon;简化背景网格线。最后可得到有 DataHunter 特色的柱状图,如下所示: (简单举例,实际真正可视化的设计效果要酷很多) ▲小数每天查看手机的次数(优化后) 小结:柱状图适合处理二维的小数据集,与条形图略有不同;可视化主要从颜色、icon运用和简化图表元素三个方面着手。 如果说柱状图适合典型的二维小数据集分析,那么折线图就是典型的二维大数据集分析工具。具体咱们还是先看官方解释:
同样我们可以提取两个重要信息点; 1.通常用于查看随着时间推移某个事物的值的变化趋势; 2.适用于连续数据 下面的例子是小数最近 30 天的步行数 ▲小数最近30天步行数趋势图 通过这个简单的折线图,可以很明显的看到这一个月里面,小数步行数的变化趋势。 同样,折线图可视化过程中有如下要点:
简单优化后如下图: ▲小数最近30天步行数趋势图(优化后) 另外提一下,可能大家会有疑惑,为什么把日期类型做了变换?因为制作这张图表的时候,我突然想到,自己的步行数是否会与工作日有关,所以就将日期类型做了简单的变换。结果也很明显,没有趋势表明我工作日比休息日步行数多,所以可视化过程中,根据自己的需求去变换图表的维度也是很重要的一点。 注意:折线图通常会与其他图形结合使用(与柱状图结合、与面积图结合等) 下面是折线图与柱状图相结合的一个简单例子,柱状图表示 2006-2010 每年的国内生产总值,折线图表示同比增长率的变化趋势。 ▲2006-2010 年国内生产总值变化图 小结:折线图适用于处理随时间变化的连续数据,可视化要点基本与柱状图相同。折线图的特点是经常与其他图形结合使用。 PS. 在可视化过程中,除了颜色和 icon 的运用,字体也是设计师需要考虑的,这里就不再举例了,感兴趣的小伙伴可以查看相关资料。 |
|