今天给大家介绍一个十分好用的Python模块,用来给数据集做一个初步的探索性数据分析(EDA)。 pygwalker模块不需要编写大量的数据可视化图表代码,即可直接将pandas.DataFrame数据对象转换成可拖拽图表。 开始之前先看看pygwalker模块的可视化图表操作页面。 接下来,有兴趣的小伙伴跟着我们一起看看如何通过一行代码最终实现这样的可视化图表。 首先需要安装我们能够使用到的python模块,使用pip的方式或conda进行安装即可。
一般在安装完成之后会出现缺失xlrd模块的报错,可能是因为底层调用了该模块,这个时候我们主动安装一下即可。
接下来可以进入正式操作的环节了,在终端启动我们已经安装好的jupyter,若是没有前往我们的历史文章搜索相关方法。 jupyter notebook 之后,我们使用pandas模块的read_excel读取我们的Excel数据源文件。
这个时候,我们已经获取到pandas.DataFrame的数据对象结果集。 只需要使用pygwalker模块的walk()函数调用pandas.DataFrame数据源即可生成数据可视化的操作平台。
上述是操作平台的左半边部分,也就是数据源的展示,右边则是可视化图表的操作部分。 我们可以在选择图表的类型后,使用拖拽的方式将源数据字段拖拽到X、Y轴,下面展示使用的是柱状图的形式。 下面是以源数据的日期字段为X轴,然后分别以成绩、年龄作为Y轴生成的柱状图。 最主要的是可以将生成好的图表直接保存为.png、.svg格式的图片直接插入到我们的文档中。 关于pygwalker模块的调用及可视化操作技巧,欢迎小伙伴在评论区留言讨论! 有需要桌面应用定制化开发的小伙伴可以前往 [软件定制活动页] 了解详情! |
|