分享

python数据分析:pandas模块的两大数据结构Series、DataFrame的不同之处

 Python集中营 2022-10-10 发布于甘肃

扩展库

1import pandas as pd
2
3import numpy as np
4
5import matplotlib.pyplot as plt

pandas.Series

 1'''pandas.Series'''
2
3# series可以理解成是一维数组的对象,有一组数据及一组与之相关的数据标签(即索引)组成
4
5'''
6pandas.Series数据结构
7pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)
8'''

9# 初始化数据
10
11series = pd.Series(["a",'b','c','d',{1,2,3,4,5,6}])
12
13from pprint import pprint
14
15pprint(series)
16
17# 0                     a
18# 1                     b
19# 2                     c
20# 3                     d
21# 4    {1, 2, 3, 4, 5, 6}
22# dtype: object
23
24'''
25指定索引打印
26'''

27series = pd.Series(["a",'b','c','d',{1,2,3,4,5,6}],index=[1,2,3,4,5])
28
29pprint(series)
30
31# 1                     a
32# 2                     b
33# 3                     c
34# 4                     d
35# 5    {1, 2, 3, 4, 5, 6}
36# dtype: object

pandas.DataFrame

 1'''pandas.DataFrame'''
2
3# Series是一组索引与一组数据组成的数据结构(行索引)、dataframe是一组数据与一对索引(行索引+列索引)组成的表格型数据结构
4
5'''
6pd.DataFrame数据结构
7pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)
8'''

9data_frame = pd.DataFrame(["a",'b','c','d',{1,2,3,4,5,6}])
10
11pprint(data_frame)
12
13#                     0
14# 0                   a
15# 1                   b
16# 2                   c
17# 3                   d
18# 4  {1, 2, 3, 4, 5, 6}
19
20'''根据结果可以看出dataframe同时存在行、列索引'''
21
22# 字典与行索引的结合使用
23
24data_frame = pd.DataFrame({"姓名":['python','laow','hello world','github'],"班级":['A班','B班','C班','D班']},
25                index=['第1行','第2行','第3行','第4行'])
26
27pprint(data_frame)
28
29#               姓名  班级
30# 第1行       python  A班
31# 第2行         laow  B班
32# 第3行  hello world  C班
33# 第4行       github  D班

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多