分享

pandasGUI,一款开源的强横数据可视化分析工具!

 Python集中营 2022-12-06 发布于甘肃

在很早之前关于可视化的描述中,我们介绍过一款D-table的数据分析操作工具。和D-table的操作相似,还有一款pandasGUI的开源工具更加强势。

Pandasgui是一个开源的python模块,它为pandas创建了一个GUI界面,我们可以在其中使用pandas的功能分析数据和使用不同的功能,以便可视化和分析数据,并执行探索性数据分析。

更重要的是pandasGUI的交互式数据绘图模块是值得一提的,主要包含几个特征:

  1. 支持DataFrames和Series数据
  2. 提供了交互式绘图
  3. 数据筛选、处理
  4. 统计摘要
  5. 数据编辑和复制/粘贴
  6. 拖放导入CSV文件

1. pandasGUI安装

安装过程也比较顺利,使用pip的方式直接安装,这里默认使用了清华大学的镜像站。

pip install pandasgui -i https://pypi.tuna./simple

注意:请尽量采用windows10以上操作系统,使用windows7在安装时会出现问题,其中底层依赖用到的python非标准模块较多,请耐心等待安装完成。

2. pandasGUI启动

启动pandasGUI的方式也比较简单,只需要几行代码并导入需要的python模块即可。

# Importing the pandas module and giving it the alias pd.
import pandas as pd

# Importing the `show` function from the `pandasgui` module.
from pandasgui import show

data_frame = pd.DataFrame()

show(data_frame)

这个时候直接启动pandasGUI发现缺少了win32api模块,就像下面这样。

    import win32api
ModuleNotFoundError: No module named 'win32api'

我们再来使用pip的方式安装一下pywin32模块即可。

pip install pywin32 -i https://pypi.tuna./simple

这次我们再运行上面的代码块就可以直接启动pandasGUI了,启动之后出现一个桌面的小工具。

接下来,我们就可以直接使用pandasGUI来处理相关的数据了,主要支持了.json、.xlsx、.csv的数据格式。

3.数据导入

在edit菜单下面直接使用import导入我们需要处理的数据文件。

在做文件数据导入的时候又发现了缺少openpyxl模块。

ModuleNotFoundError: No module named 'openpyxl'

同样,使用pip的方式安装一下即可。

pip install openpyxl -i https://pypi.tuna./simple

由于是python的新环境,有些模块并没有自动安装,因此需要我们手动安装一下,安装完成之后重新启动一下。

再来导入一下我们准备好的数据文件。

4. 数据筛选

数据筛选也比较简单,只需要输入字段对应的筛选条件即可,比如我们需要筛选年龄大于10的数据,添加如下筛选条件即可。

年龄 > 10

其他的使用方式都比较简单,这里就不多作介绍了,下面主要来看一下几种比较好的数据可视化操作。

「Python 集中营」,只做知识分享 !

手撕一个图片色卡提取器,可自定义提取色卡数量!

python自动化:使用socket做一个多进程的端口扫描器!

python 如何实现数据可视化大屏布局!

数据可视化:四种关系图数据可视化的效果对比!

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多