分享

小象学院学习---数据分析常用图标的绘制

 落日下旳余晖 2018-04-20
能用pandas和Seaborn绘出的图,优先考虑使用这两个绘图,因为比较简单,比较好看。
绘制一些特殊的图形,自定义的图形是使用matplotlib

matplotlib绘图

1 直方图

直方图是一种对数据分布情况的图形表示

首先要对数据进行分组,然后统计每个分组内数据的数量。
作用:
   显示各分组频率或数量分布的情况
   易于显示各组之间频率或数量的差别
plt.hist(data,bins)
data:数据列表
bins:分组边界或分组个数

2 盒形图
 盒子的上边缘和下边缘指示四分位数间距(IQR)
 即介于第一个和第三个四分位数(第25百分位数和第75百分位数)之间的值得范围。盒子内的标记指示均值。盒子内的线指示中位数值。
  若不启用离群值,则需线延伸到途中的最大值和最小值。
若启用离群值,它们是与四分位间距的距离超过四分位间距大小1.5倍的数据点。
plt.boxplot()
whis默认为1.5启用离群值;'range’为不启用离群值。

3 热图
可用于三维数据的可视化

plt.imshow(arr)#显示矩阵数据,三维数组(横坐标,纵坐标,像素值)
plt.hist2d()
plt.colorbar()添加颜色条


Pandas 绘图
df.plot(kind=)  kind用于指示绘图的类型
pd.plotting.scatter.matrix()
pd.plotting.parallel.ccordinates()

Seaborn绘图
什么是Seaborn
python中的一个制图工具库,可以制作出吸引人的、信息量大的统计图
在Matplotlib上构建,支持numpy和pandas的数据结构可视化,甚至是scipy和statsmodels的统计模型可视化

特点
多个内置主题及颜色主题
可视化单一变量、二维变量用于比较数据集中各变量的分布情况
可视化线性回归模型中的独立变量及不独立变量
可视化矩阵数据,通过聚类算法探究矩阵间的结构
可视化时间序列数据及不确定性的展示
可在分割区域制图,用于复杂得可视化

其他常用的可视化工具
D3.js
D3(Data-Driven Documents),被数据驱动的文档。是一个用动态图形显示数据的JavaScript库,一个数据可视化的工具。
mpld3
http://thub。io/
讲Matplotlib和D3js结合起来的基于Python的可视化工具
pip install mpld3

echarts(非常强大)
一个纯Javascript的图表库,可以流畅的运行在PC和移动设备上,兼容当前绝大部分浏览器,底层依赖轻量级的Canvas类库ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。

pyecharts(交互性很好)
http:///#/zh-cn/
pyecharts是为了与python进行对接,方便在python中直接使用数据生成图
pip install pyecharts
详细使用方法:http:///#/zh-cn/prepare


    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多