python分两列输出

天上飞鸡 2020-12-28

展开全文

分割成一个包含两个元素列表的列

对于一个已知分隔符的简单分割(例如，用破折号分割或用空格分割).str.split() 方法就足够了。它在字符串的列(系列)上运行，并返回列表(系列)。

>>> import pandas as pd

>>> df = pd.DataFrame({'AB': ['A1-B1', 'A2-B2']})

>>> df

0 A1-B1

1 A2-B2

>>> df['AB_split'] = df['AB'].str.split('-')

>>> df

AB AB_split

0 A1-B1 [A1, B1]

1 A2-B2 [A2, B2]

分割成两列，每列包含列表的相应元素

下面来看下如何从：分割成一个包含两个元素列表的列至分割成两列，每列包含列表的相应元素。

>>> df['AB'].str[0]

0 A

1 A

Name: AB, dtype: object

>>> df['AB'].str[1]

0 1

1 2

Name: AB, dtype: object

因此可以得到

>>> df['AB'].str.split('-', 1).str[0]

0 A1

1 A2

Name: AB, dtype: object

>>> df['AB'].str.split('-', 1).str[1]

0 B1

1 B2

Name: AB, dtype: object

可以通过如下代码将pandas的一列分成两列：

>>> df['A'], df['B'] = df['AB'].str.split('-', 1).str

>>> df

AB AB_split A B

0 A1-B1 [A1, B1] A1 B1

1 A2-B2 [A2, B2] A2 B2

补充知识：pandas某一列中每一行拆分成多行的方法

在处理数据过程中，常会遇到将一条数据拆分成多条，比如一个人的地址信息中，可能有多条地址，既有家庭地址也有工作地址，还有电话信息等等类似的情况，实际使用数据的时候又需要分开处理，这个时候就需要将这一条数据进行拆分成多条，以方便使用。

在pandas中如何对DataFrame进行相关操作呢，经查阅相关资料，发现了一个简单的办法，

info.drop(['city'], axis=1).join(info['city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename('city'))

看起来非常之长，分开来看，流程如下：

将需要拆分的数据使用split拆分工具拆分，并使用expand功能拆分成多列

将拆分后的多列数据进行列转行操作(stack)，合并成一列

将生成的复合索引重新进行reset保留原始的索引,并命名

将上面处理后的DataFrame和原始DataFrame进行join操作，默认使用的是索引进行连接

具体操作如下：

预操作：生成需要使用的DataFrame

# 用来生成DataFrame的工具

from pydbgen import pydbgen

myDB=pydbgen.pydb()

# 生成一个DataFrame

info = myDB.gen_dataframe(10,['name','phone','city','state'])

结果如下：

name

phone-number

city

state

Hannah Richard

810-859-7815

Irwinville

Louisiana

Ronald Berry

591-564-0585

Glen Ellen

Minnesota

Caitlin Barron

969-840-8580

Dubois

Oklahoma

Felicia Stephens

154-858-1233

Veedersburg

Alaska

Shelly Dennis

343-104-9365

Mattapex

Virginia

Nicholas Hill

992-239-1954

Moneta

Minnesota

Steve Bradshaw

164-081-7811

Ten Broeck

Colorado

Gail Johnston

155-259-9514

Wayan

Virginia

John Gray

409-892-4716

Darlington

Pennsylvania

Katherine Bautista

185-861-1677

McNab

Texas

假如现在我们要对city列进行进行拆分，按照空格拆分，转换成多行的数据，

第一步：拆分，生成多列

info_city = info['city'].str.split(' ', expand=True)

结果如下：

Irwinville

None

Glen

Ellen

Dubois

None

Veedersburg

None

Mattapex

None

Moneta

None

Ten

Broeck

Wayan

None

Darlington

None

McNab

None

可以看到已经将原始数据拆分成了2列，对于无法拆分的数据为None

第二步：行转列

info_city = info_city.stack()

结果如下：

Irwinville

Glen

Ellen

Dubois

Veedersburg

Mattapex

Moneta

Ten

Broeck

Wayan

Darlington

McNab

其中前面两列是索引，返回的是一个series，没有名字的series

第三步：重置索引，并命名(并删除多于的索引)

info_city = info_city.reset_index(level=1, drop=True)

结果如下：

Irwinville

Glen

Ellen

Dubois

Veedersburg

Mattapex

Moneta

Ten

Broeck

Wayan

Darlington

McNab

第四步：和原始数据合并

info_new = info.drop(['city'], axis=1).join(info_city)

结果如下：

name

phone-number

state

city

Hannah Richard

810-859-7815

Louisiana

Irwinville

Ronald Berry

591-564-0585

Minnesota

Glen

Ronald Berry

591-564-0585

Minnesota

Ellen

Caitlin Barron

969-840-8580

Oklahoma

Dubois

Felicia Stephens

154-858-1233

Alaska

Veedersburg

Shelly Dennis

343-104-9365

Virginia

Mattapex

Nicholas Hill

992-239-1954

Minnesota

Moneta

Steve Bradshaw

164-081-7811

Colorado

Ten

Steve Bradshaw

164-081-7811

Colorado

Broeck

Gail Johnston

155-259-9514

Virginia

Wayan

John Gray

409-892-4716

Pennsylvania

Darlington

Katherine Bautista

185-861-1677

Texas

McNab

需要特别注意的是，需要使用原始的连接新生成的，因为新生成的是一个series没有join方法，也可以通过将生成的series通过to_frame方法转换成DataFrame，这样就没有什么差异了

写了这么多，记住下面的就行了：

info.drop([‘city'], axis=1).join(info[‘city'].str.split(' ', expand=True).stack().reset_index(level=1, drop=True).rename(‘city'))

如果原数据中已经是list了，可以将info[‘city'].str.split(' ', expand=True)这部分替换成info[‘city'].apply(lambda x: pd.Series(x))，就可以达到相同的目的。

以上这篇Pandas实现一列数据分隔为两列就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

本站是提供个人知识管理的网络存储空间，所有内容均由用户发布，不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息，谨防诈骗。如发现有害或侵权内容，请点击一键举报。

转藏分享

QQ空间 QQ好友新浪微博微信

献花（0） +1

来自：天上飞鸡 > 《Pandas》

举报/认领

0条评论

发表

请遵守用户评论公约

类似文章 更多

天上飞鸡

关注对话

TA的最新馆藏

Power Query M语言全部list函数，快速分类掌握
[转] 降息降准到底有什么用？
[转] 专题知识：降息和降准有什么区别？
[转] 主码图，ZIG、未来、漂移、预判、纠错、参数自修正等
[转] 对买卖提示指标的探索和改进(之字转向ZIG)
[转] BACKSET和ZIG的实战意义[引用] - 农夫山泉-有点田的日志 - 网易博客

喜欢该文的人也喜欢更多

热门阅读换一换