分享

pandas基础教程(四) DataFrame的前世今生

 网摘文苑 2022-11-27 发布于新疆

#头条创作挑战赛#

DataFrame


DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。

pandas基础教程(四) DataFrame的前世今生
pandas基础教程(四) DataFrame的前世今生

DataFrame 构造方法如下:

pandas.DataFrame( data, index, columns, dtype, copy)

参数说明:

  • data:一组数据(ndarray、series, map, lists, dict 等类型)。
  • index:索引值,或者可以称为行标签。
  • columns:列标签,默认为 RangeIndex (0, 1, 2, …, n) 。
  • dtype:数据类型。
  • copy:拷贝数据,默认为 False。

Pandas DataFrame 是一个二维的数组结构,类似二维数组。

使用列表创建

In [1]:

import pandas as pddata = [['Geogle',10],['baidu',8],['360',5]]df = pd.DataFrame(data,columns=['Name','Age'],dtype=float)print(df)
     Name   Age0  Geogle  10.01   baidu   8.02     360   5.0

使用 ndarrays 创建

In [2]:

import pandas as pddata = {'Name':['Google', 'Baidu', '360'], 'Age':[10, 8, 5]}df = pd.DataFrame(data)print(df)
     Name  Age0  Google   101   Baidu    82     360    5

使用字典创建

In [5]:

import pandas as pddata = [{'Google':10,'Baidu':8,'360':5}]df = pd.DataFrame(data)print(df)
   Google  Baidu  3600      10      8    5

Pandas 可以使用 loc 属性返回指定行的数据

In [7]:

import pandas as pddata = {'calories': [420, 380, 390],'duration': [50, 40, 45]}# 数据载入到 DataFrame 对象df = pd.DataFrame(data)# 返回第一行print(df.loc[0]) # 返回第一行和第二行print(df.loc[[0, 1]])
calories    420duration     50Name: 0, dtype: int64   calories  duration0       420        501       380        40

指定索引值

In [4]:

import pandas as pddata = {br 'calories': [420, 380, 390],'duration': [50, 40, 45]} # 数据载入到 DataFrame 对象df = pd.DataFrame(data,index=['day01','day02','day03'])# 返回caloriesprint(df.loc['day01'])
calories    420duration     50Name: day01, dtype: int64

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多