搜索

分享

QQ空间 QQ好友新浪微博微信

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

copy_left 2019-10-16

展开全文

导读

数据导入是数据处理、分析的第一步，Pandas提供非常多的方法，对不同格式、不同来源的数据进行导入和导出操作。

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

Pandas对以下数据源导入/导出方法列表：

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

Pandas还有很多数据导入/导出方法，不是特别常用，就没有列举

比较常用的：

对CSV文件的读写：read_csv\to_csv
对excel文件的读写：read_excel\to_excel

Pandas数据导入方法参数比较多，容错性，识别能力较好：

支持类型推断和数据转换
支持用户自定义的值转换，自定义的缺失值
支持时间日期识别，自动解析
支持对大型文件的分块迭代
清理数据功能：跳过行、页脚、注释以及其他次要数据
识别数字千位符号

使用read_csv/to_csv方法，对csv格式数据文件进行导入/导出操作

pd.read_csv方法，数据导入

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

read_csv方法一些参数说明：

path 文件路径
sep/delimiter 指定分隔符
header 指定哪行作为列名，默认为0，如果文件中没有列名，可设置为None
index_col 指定那列作为行索引的列编号或者列名
names 指定列名列表
skiprows 忽略跳过的行数、行号列表
na_values 替代缺失值的列表
comment 在行结尾处分隔注释的字符
parse_dates 尝试将数据解析为datetime，默认是False，如果是True，将尝试解析所有列，也可以指定列号列名列表进行解析
converters 列名称跟函数映射的字典
dayfirst 解析费明确日期时，按照国际格式处理，默认是False
date_parser 指定用于解析日期的函数
nrows 从文件开头处读入的行数
skip_footer 忽略文件尾部的行数
encoding 指定文件编码
thousands 指定千分位分隔符

pd.to_csv方法，数据导出

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

参数说明：

指定输出文件名
sep：用’,’分隔
header：是否带头部信息
index：是否带行号

使用read_excel/to_excel方法，对Excel文件进行导入/导出操作

使用Pandas进行数据处理，CSV、Excel文件载入和导出操作

最后

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自： copy_left > 《python相关》

举报/认领

0条评论

请遵守用户评论公约

类似文章 更多

copy_left

关注对话

TA的最新馆藏

6大体质，中医教你分清楚
医生教你简单快速看心电图，建议收藏！
[转] 锐捷交换机常用配置命令汇总，弱电人要看看，以后肯定用得到
[转] H3C交换机配置命令大全
能用到 “ 退休 ” 的 600条 Linux 命令，可以解决日常 99% 的问题~
[转] Nmap命令的实例用于Linux系统/网络管理员

喜欢该文的人也喜欢更多

热门阅读换一换