能用pandas和Seaborn绘出的图,优先考虑使用这两个绘图,因为比较简单,比较好看。 绘制一些特殊的图形,自定义的图形是使用matplotlib matplotlib绘图 1 直方图 直方图是一种对数据分布情况的图形表示 首先要对数据进行分组,然后统计每个分组内数据的数量。 作用: 显示各分组频率或数量分布的情况 易于显示各组之间频率或数量的差别 plt.hist(data,bins) data:数据列表 bins:分组边界或分组个数 2 盒形图 盒子的上边缘和下边缘指示四分位数间距(IQR) 即介于第一个和第三个四分位数(第25百分位数和第75百分位数)之间的值得范围。盒子内的标记指示均值。盒子内的线指示中位数值。 若不启用离群值,则需线延伸到途中的最大值和最小值。 若启用离群值,它们是与四分位间距的距离超过四分位间距大小1.5倍的数据点。 plt.boxplot() whis默认为1.5启用离群值;'range’为不启用离群值。 3 热图 可用于三维数据的可视化 plt.imshow(arr)#显示矩阵数据,三维数组(横坐标,纵坐标,像素值) plt.hist2d() plt.colorbar()添加颜色条 Pandas 绘图 df.plot(kind=) kind用于指示绘图的类型 pd.plotting.scatter.matrix() pd.plotting.parallel.ccordinates() Seaborn绘图 什么是Seaborn python中的一个制图工具库,可以制作出吸引人的、信息量大的统计图 在Matplotlib上构建,支持numpy和pandas的数据结构可视化,甚至是scipy和statsmodels的统计模型可视化 特点 多个内置主题及颜色主题 可视化单一变量、二维变量用于比较数据集中各变量的分布情况 可视化线性回归模型中的独立变量及不独立变量 可视化矩阵数据,通过聚类算法探究矩阵间的结构 可视化时间序列数据及不确定性的展示 可在分割区域制图,用于复杂得可视化 其他常用的可视化工具 D3.js D3(Data-Driven Documents),被数据驱动的文档。是一个用动态图形显示数据的JavaScript库,一个数据可视化的工具。 mpld3 http://thub。io/ 讲Matplotlib和D3js结合起来的基于Python的可视化工具 pip install mpld3 echarts(非常强大) 一个纯Javascript的图表库,可以流畅的运行在PC和移动设备上,兼容当前绝大部分浏览器,底层依赖轻量级的Canvas类库ZRender,提供直观,生动,可交互,可高度个性化定制的数据可视化图表。 pyecharts(交互性很好) http:///#/zh-cn/ pyecharts是为了与python进行对接,方便在python中直接使用数据生成图 pip install pyecharts 详细使用方法:http:///#/zh-cn/prepare |
|