本系列文章还是引用之前的理念,阅读文章,你不需要记,只要知道这一篇在讲什么即可,收藏起来,用的时候过来抄代码。 提前说明,本篇文章代码演示较多, 建议收藏后在阅读, 如果能动手实践效果加倍。 在本篇文章中,我们将深入探讨Pandas中的数据选择与过滤技巧,帮助您灵活地提取和操作数据。下面是我们将要讲解的关键内容: ![]() 一、关键内容通过掌握本篇文章中介绍的强大索引技巧,您将能够准确地选择和过滤数据,根据需求提取出所需的数据子集,为后续的分析和建模工作提供支持。 1.1 单列选择:
1.2 多列选择:
1.3 行选择:
1.4 切片选择:
1.5 条件选择:
二、单列选择2.1 使用标签选择通过[]直接使用列的标签选中列。 import pandas as pd# 创建示例DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}df = pd.DataFrame(data)# 使用标签选择单列数据column_A = df['A']# 0 1# 1 2# 2 3# 3 4# 4 5print(column_A) 2.2 使用位置选择
2.3 使用布尔索引import pandas as pd# 创建示例DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}df = pd.DataFrame(data)# A B# 1 2 7# 2 3 8# 3 4 9# 4 5 10print(df[df['A'] >= 2]) 三、多列选择3.1 使用标签选择
3.2 使用位置选择import pandas as pd# 创建示例DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15]}df = pd.DataFrame(data)# 使用位置选择多列数据# A B# 0 1 6# 1 2 7# 2 3 8# 3 4 9# 4 5 10columns_01 = df.iloc[:, [0, 1]]print(columns_01) 四、行选择4.1 使用标签选择为了方便举例,我们指定了索引是从a-e。 然后使用索引b选中b行
4.2 使用位置选择如果我们索引指定,那么 df.loc['b'] = df.loc[1] import pandas as pd# 创建示例DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}df = pd.DataFrame(data)# A B# 0 1 6# 1 2 7# 2 3 8# 3 4 9# 4 5 10print(df)# 使用标签选择单行数据# A 2# B 7print(df.loc[1]) 4.3 使用布尔索引
五、切片选择5.1 使用标签切片
import pandas as pd# 创建示例 DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10], 'C': [11, 12, 13, 14, 15]}df = pd.DataFrame(data, index=['a', 'b', 'c', 'd', 'e'])# 使用行索引切片选择子集数据subset = df['a':'b']# A B C# a 1 6 11# b 2 7 12print(subset) 5.2 使用位置切片
六、条件选择6.1 布尔条件import pandas as pd# 创建示例DataFramedata = {'A': [1, 2, 3, 4, 5], 'B': [6, 7, 8, 9, 10]}df = pd.DataFrame(data)# 使用布尔条件选择满足条件的数据filtered_data = df[df['A'] > 3]print(filtered_data) 6.2 isin() 方法
![]() 文章内容较多,建议收藏后,慢慢观看,你的关注是我继续的动力。 |
|