Pandas的条件过滤是使用非常频繁的技巧,在这一节我们将看到各种不同的过滤技巧,如果读者有其它过滤技巧,也欢迎告诉我。 条件过滤与赋值通过loc进行行过滤,并对过滤后的行进行赋值
除了上述的过滤方式外,还可以通过query method来进行过滤查询,如下:
空值判断在数据处理的过程中,空值判断是非常常用的技巧,在Pandas中我们主要通过以下几种方式来判断空值。
isnull函数
将isnull用于过滤条件:
notnull函数notnull的使用与isnull类似,如下:
np.isnan函数需要注意的是判断dataframe中某个值是否为空,不能直接用== np.nan来判断,而需要使用np.isnan函数如下
isin函数使用isin函数
多过滤条件当有多个过滤条件时,我们就需要使用逻辑操作符
过滤后的赋值计算在实际项目中,很多时候我们根据条件选取了一些行之后,我们要针对这些行中的数据需要做些操作(比如针对age进行加1操作),更复杂的我们需要获取本行的其它列的数据共同计算和判断。这里我们可以使用如下技巧:
关于vectorization矢量化的相关议题,可以参考文章Pandas系列4-数据矢量化 |
|