分享

python数据分析 | 多种方式获取pandas.DataFrame数据对象

 Python集中营 2022-10-10 发布于甘肃

相关扩展库

1# -*- coding: UTF-8 -*-
2
3# 导入扩展库
4
5import pandas as pd
6
7import numpy as np

创建空DataFrame对象

1# 自定义列名创建空的DataFrame数据对象
2
3df = pd.DataFrame(columns={"name""""age""""sex""""score""""rate"""})
4
5print(df)
6
7# Empty DataFrame
8# Columns: [name, age, sex, score, rate]
9# Index: []

数组创建DataFrame对象

 1# 自定义数组创建DataFrame对象
2
3list_data = [['1''2''3']]
4
5df = pd.DataFrame(list_data, columns=['first''second''third'])
6
7print(df)
8
9#   first second third
10# 0     1      2     3

字典创建DataFrame对象

 1# 自定义字典类型的数据创建DataFarme对象
2
3data_dict = {'first_col': [1234], 'second_col': [5678]}
4
5df = pd.DataFrame(data_dict)
6
7print(df)
8
9#    first_row  second_row
10# 0          1           5
11# 1          2           6
12# 2          3           7
13# 3          4           8

文件返回DataFrame对象

1# 读取数据文件返回DataFrame对象
2
3df=pd.read_csv('/usr/load/data.csv',split=',')
4
5df=pd.read_csv('/usr/load/data.xls',sheet_name='data')
6
7print(df)

np创建DataFrame对象

 1# 使用numpy科学计算库提供的二维数组创建DataFrame对象
2
3data_array = np.random.rand(42)
4
5df = pd.DataFrame(data_array, columns=['first''second'])
6
7print(df)
8
9#       first    second
10# 0  0.410413  0.510788
11# 1  0.726956  0.647775
12# 2  0.502573  0.226714
13# 3  0.926117  0.124414


关注 Python集中营
领取编程干货
培养编程思想

    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多