分享

用Python进行数据可视化的10种方法

 powerbaby 2016-04-15

关于转载授权


编译|黄念

校对|丁一


引言


艺术之美根植于其所传达的信息。有时候,现实并非我们所看到或感知到的。达芬奇(Da Vinci)和毕加索(Picasso)等艺术家都通过其具有特定主题的非凡艺术品,试图让人们更加接近现实。


数据科学家并不逊色于艺术家。他们用数据可视化的方式绘画,试图展现数据内隐藏的模式或表达对数据的见解。更有趣的是,一旦接触到任何可视化的内容、数据时,人类会有更强烈的知觉、认知和交流。


在数据科学中,有多种工具可以进行可视化。在本文中,我展示了使用Python来实现的各种可视化图表。


怎样才能在Python实现可视化?


涉及到的东西并不多!Python已经让你很容易就能实现可视化——只需借助可视化的两个专属库(libraries),俗称matplotlib和seaborn。听说过吗?


Matplotlib:基于Python的绘图库为matplotlib提供了完整的2D和有限3D图形支持。这对在跨平台互动环境中发布高质量图片很有用。它也可用于动画。


Seaborn:Seaborn是一个Python中用于创建信息丰富和有吸引力的统计图形库。这个库是基于matplotlib的。Seaborn提供多种功能,如内置主题、调色板、函数和工具,来实现单因素、双因素、线性回归、数据矩阵、统计时间序列等的可视化,以让我们来进一步构建复杂的可视化。


我能做哪些不同的可视化?


刚出版不久的《A comprehensive guide on Data Visualization》中,介绍了最常用的可视化技术。在进一步深入学习前,如果你尚未阅读此书,我们建议你参考此书。


以下是Python代码与其输出结果。我就是用下面的数据集来创建这些可视化的。




导入数据集




1.直方图




2.箱线图




3.小提琴图




4.条形图





5.折线图



6.堆积柱形图



7.散点图



8.气泡图



9.饼图




10.热图


你可以尝试绘制基于两个变量的热图,如X轴为性别,Y轴为BMI,数据点为销售值。



结语


现在,你肯定已经意识到了数据可视化的美妙,为什么不自己动手试试呢?在以后的文章中,我们还将探讨用Python实现地图可视化和词云。

大数据文摘也曾经发布过用R进行数据可视化的文章,《用R语言进行数据可视化的综合指南(一)》和《用R语言进行数据可视化的综合指南(二)》。大家可以参考一下,做个对比。


用R语言进行数据可视化的综合指南(一)

用R语言进行数据可视化的综合指南(二)




    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多