分享

python数据分析学习(6)输入载入,存储及文件格式(1)文本格式数据的读写

 小样样样样样样 2020-05-25

  pandas可以进行数据输入和输出,有以下几种类型:读取文本文件及硬盘上其他更高效的格式文件,从数据库中载入数据,于网络资源进行交互(比如Web API)。

  下面进行不同文本文件的读取和写入操作讲解,首先进行文本格式数据的读写讲解。

一:文本格式数据的读写

  将表格型数据读取为DataFrame对象是pandas的重要特性。下面介绍一下一些方法。

  pd.read_csv():将csv文件数据读入一个DataFrame。

  pd.read_table():将csv文件数据读入一个DataFrame,可以用sep指定分隔符,一般为",",可以针对不同的分隔符号用正则表达式分隔。

  有时候文件并不包含表头行,就需要选择一些选项,用header=None可以自动分配默认列名,或者可以自己用names指定列名。

  如果想要指定某一列作为索引,可以直接指定,或者将该列的列名传给参数index_col。 在index_col里面可以用列表作为参数,形成一个分层索引。

  使用skiprows可以跳过某些行,且使用isnull可以检测数组中的缺失值。

  使用na_values选项可以传入一个列表或一组字符串来处理缺失值。或者用字典指定列的缺失值标识。

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多