分享

Pandas DataFrames筛选数据

 imelee 2017-05-17

[python] view plain copy
  1. </pre><span style="font-size:18px">最近突然发现了pandas真实特别好用,实在需要好好学习下。貌似经过pd方法导入的数据都是DataFrame类型(二维)或者Series类型(一维)。今天在百度经验里看到了DataFrame的数据筛选,自己也尝试了下,顺便记录下来。</span><p></p><p><span style="font-size:18px">1.先加载os包,打开一个csv文件,读出其中内容</span></p><p></p><pre name="code" class="python">import os  
  2. import pandas as pd   
  3. aqicsv = pd.read_csv("D:\\aqifit_numsum10\\newaqifit.csv")  



2.此时的aqicsv为DataFrame格式,可进行describe操作,获得一些统计上的指标

[python] view plain copy
  1. aqicsv["predictaqi_norm1"].describe()  


3.可筛选出predictaqi_norm1这一列大于100的行

[python] view plain copy
  1. aqicsv[aqicsv["predictaqi_norm1"]>100]  
[python] view plain copy
  1. <span style="font-family: Arial, Helvetica, sans-serif;"></span><pre name="code" class="python"><span style="font-family: Arial, Helvetica, sans-serif;">aqicsv[aqicsv.predictaqi_norm1>100]</span><span style="font-family: Arial, Helvetica, sans-serif;"> </span>  



4.可使用&(并)与| (或)实现多条件筛选

[python] view plain copy
  1. aqicsv[(aqicsv["FID"]>37898) & (aqicsv["FID"]<38766) ]  

[python] view plain copy
  1. aqicsv[(aqicsv.predictaqi_norm1>150) |(aqicsv.predictaqi_norm1<100) ]  


5.如果只需要其中两列数据,而同时利用另外两列进行筛选时可以这样.如果只需要其中的某几列可以写为aqicsv[['FID','x','y']]

[python] view plain copy
  1. aqicsv[['x','y']][(aqicsv.FID >10000) | (aqicsv.predictaqi_norm1 >150)]  


6.可用isin方法筛选一些特定值,但要将其写入某一列中

[python] view plain copy
  1. testlist = aqicsv.predictaqi_norm1[:50]  

[python] view plain copy
  1. aqicsv['predictaqi_norm1'].isin(testlist)  



    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多