扩展库
1import pandas as pd
2
3import numpy as np
4
5import matplotlib.pyplot as plt
pandas.Series
1'''pandas.Series'''
2
3# series可以理解成是一维数组的对象,有一组数据及一组与之相关的数据标签(即索引)组成
4
5'''
6pandas.Series数据结构
7pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
8'''
9# 初始化数据
10
11series = pd.Series(["a",'b','c','d',{1,2,3,4,5,6}])
12
13from pprint import pprint
14
15pprint(series)
16
17# 0 a
18# 1 b
19# 2 c
20# 3 d
21# 4 {1, 2, 3, 4, 5, 6}
22# dtype: object
23
24'''
25指定索引打印
26'''
27series = pd.Series(["a",'b','c','d',{1,2,3,4,5,6}],index=[1,2,3,4,5])
28
29pprint(series)
30
31# 1 a
32# 2 b
33# 3 c
34# 4 d
35# 5 {1, 2, 3, 4, 5, 6}
36# dtype: object
pandas.DataFrame
1'''pandas.DataFrame'''
2
3# Series是一组索引与一组数据组成的数据结构(行索引)、dataframe是一组数据与一对索引(行索引+列索引)组成的表格型数据结构
4
5'''
6pd.DataFrame数据结构
7pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
8'''
9data_frame = pd.DataFrame(["a",'b','c','d',{1,2,3,4,5,6}])
10
11pprint(data_frame)
12
13# 0
14# 0 a
15# 1 b
16# 2 c
17# 3 d
18# 4 {1, 2, 3, 4, 5, 6}
19
20'''根据结果可以看出dataframe同时存在行、列索引'''
21
22# 字典与行索引的结合使用
23
24data_frame = pd.DataFrame({"姓名":['python','laow','hello world','github'],"班级":['A班','B班','C班','D班']},
25 index=['第1行','第2行','第3行','第4行'])
26
27pprint(data_frame)
28
29# 姓名 班级
30# 第1行 python A班
31# 第2行 laow B班
32# 第3行 hello world C班
33# 第4行 github D班