分享

Pandas系列5

 北方的白桦林 2019-05-26

Pandas的条件过滤是使用非常频繁的技巧,在这一节我们将看到各种不同的过滤技巧,如果读者有其它过滤技巧,也欢迎告诉我。

条件过滤与赋值

通过loc进行行过滤,并对过滤后的行进行赋值

除了上述的过滤方式外,还可以通过query method来进行过滤查询,如下:

空值判断

在数据处理的过程中,空值判断是非常常用的技巧,在Pandas中我们主要通过以下几种方式来判断空值。

  • isnull函数: 用于针对Series、DataFrame判断是否为null
  • notnull函数: 用于判断非null值
  • np.isnan函数: 用于针对某个标量值进行判断是否为nan(null)。需要注意的是这个函数不能用于字符串类型的值进行判断,因此如果array中有字符串类型,需要用其它方式进行判断,如isinstance
isnull函数

将isnull用于过滤条件:

notnull函数

notnull的使用与isnull类似,如下:

np.isnan函数

需要注意的是判断dataframe中某个值是否为空,不能直接用== np.nan来判断,而需要使用np.isnan函数如下

isin函数

使用isin函数

多过滤条件

当有多个过滤条件时,我们就需要使用逻辑操作符&, |,如下:

过滤后的赋值计算

在实际项目中,很多时候我们根据条件选取了一些行之后,我们要针对这些行中的数据需要做些操作(比如针对age进行加1操作),更复杂的我们需要获取本行的其它列的数据共同计算和判断。这里我们可以使用如下技巧:

关于vectorization矢量化的相关议题,可以参考文章Pandas系列4-数据矢量化

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多