分享

pandas读写文本(csv)文件

 网摘文苑 2022-11-13

CSV文件是一种纯文本文件,可以使用任何文本编辑器进行编辑,它支持追加模式,节省内存开销。因为csv文件具有诸多的优点,所以在很多时候会将数据保存到csv文件中


Pandas中提供了read_csv()函数与to_csv()方法,分别用于读取CSV文件和写入CSV文件,关于他们的具体介绍如下:

1.通过to_csv()方法将数据写入CSV文件:to_csv(path_or_buf=None,sep=',’,na_rep='',float_format=None,columns=None,header=True,index=True,index_label=None,mode='w’,encoding=None,compression=None,quoting=None,quotechar='“”',line_terminator='\n',chunksize=None,tuplesize_cols=None,date_format=None,doublequote=True,escapechar=None,decimal='.')

  • path_or_buf:文件路径
  • index:布尔值,默认为True。如果为False,则将不会显示索引
  • sep:分隔符,默认用 ' . ' 隔开

如果指定的路径下文件不存在,则会创建一个文件来保存数据;如果文件已经存在,则会将文件中的内容进行覆盖


接下来,通过一段代码来演示将DataFrame对象中的数据写入到CSV文件中:

文章图片1

2.通过read_csv()函数读取CSV文件的数据;read_csv()函数的作用是将CSV文件的数据读取出来,并转换成DataFrame对象。read_csv()函数的语法:read_csv(filepath_or_buffer,sep=',',delimiter=None,header='infer',names=None,index_col=None,usecols=None,squeeze=False,perfix=None,mangle_dupe_cols=True,dtype=None...)

上述函数中常用参数表示的含义如下:

  • filepath_or_buffer:表示文件路径,可以为URL字符串
  • sep:分隔符,默认用 ' ,' 隔开
  • header:指定行数用来作为列名,如果读取的文件中没有列名,则默认为0,否则设置为None
//指定的行数如果在中间行,上面的行不要,拿它下面的行作为数据,自己做为列名,反正处于它下面的才会要
  • names:用于结果的列名列表。如果文件不包含标题行,则应该将该参数设置为None
  • index_col:用作行索引的列编号或者列名,如果给定一个序列,则表示有多个行索引 //index_col=多少,就把那一列作为索引列,比如index_col=1,把1作为索引列

接下来,使用read_csv()函数将文件读取出来:

文章图片2

#read_table()和 read_csv()的区别在于使用的分隔符不同,前面为',',后面为'\t'


header参数用法:

文章图片3

index_col参数的用法:

文章图片4

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多