分享

关于在python中如何使用pandas库读取excel表格后 删除含有空值的列

 印度阿三17 2020-02-24

在使用pandas读入相关的excel后,若是表格中有空值的列,要如何清洗呢
在查阅了网上的相关的资料后,得到了办法

pandas.dropna(axis=1,how=‘any’)

axis=0指行,若是参数中不写,则是默认为axis=0,
axis=1则是指列

how=‘any’则是指只要列中含有一个空值,就删除该列
how='all’则是代表只有一整列为空值,才删除该列

需要注意的是在python3.7的版本里
使用pandas.dropna需要有一个变量来接收返回值
否则在运行程序的时候 不会报错 但数据也不会发生改变


再写一些pandas库中关于excel表格的操作

#encoding=gb18030
import numpy
import pandas as pd
data_filename = "data/data21695/数据.xlsx"
df = pd.read_excel(data_filename)
x = df.dropna(axis=1,how='any')
g=df["编号"]
y = len(g)
i=0
print(y)
del x["无机盐"]
x["无敌"]=x["身高"]
for i in range(y):
    x.iloc[i,0]=i

x.to_excel('new.xlsx')

pandas.read_excel 读入excel表格

del[‘无机盐’] 删除名为无机盐的列

x[‘无敌’]=x[‘身高’] 添加一列名为无敌,将身高这一列的数据复制到无敌这一列

x.iloc[i,0] 获取第i行,第0列的数据

x.to_excel 导入至名为new.xlsx的excel表格中

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多