分享

【Python3】pandas.read

 hdzgx 2020-01-05

Python数据分析,一般第一步就是读取数据,这篇详解pandas读取数据read_csv。

  1. read_csv函数参数
    几个常用的参数包括path、sep、header、index_col、names、skiprows、na_values、nrows、skip_footer、encoding。下面主要对这几个参数解释 。在这里插入图片描述
    在这里插入图片描述

  2. 读取文件,必要参数path给出文件路径,encoding设置csv文件编码格式,默认为“utf-8”,这里文件格式为“gbk”。
    在这里插入图片描述

  3. sep给出文件分隔符,默认为‘,’,这里文件分隔符也是‘,’,如果分隔符为其他符号,可以用此参数。
    在这里插入图片描述

  4. header默认为0,表示第0行为标题,可以给定None表示文件无标题,同时在header为None时可以给定参数names来给定列名。
    在这里插入图片描述
    在这里插入图片描述

  5. skiprows可以选择忽略前面的行数,通过下图可以对比使用skiprows前后的shape。
    在这里插入图片描述

  6. na_values可以用来替换NA值,当然这里我的数据没有NA,如果有的话可以用这个参数。

  7. nrows从文件开始时选取需要读取的行数。可以看到使用nrows=3之后,数据只有前三行。(df.head()默认读取前五行)
    在这里插入图片描述

  8. skipfooter从文件末尾选择需要忽略的行数。忽略了28行之后,只剩下前五行了。
    在这里插入图片描述

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多