本次给大家介绍关于pandas 行列转换2个常用技巧。 在我们处理数据的过程中,经常会遇到这样的情况。 工作中,比如用户画像的数据中也会遇到,客户使用的app类型就会以这种长列表的形式或者以逗号隔开的字符串形式展现出来。 使用 explode 这个 “爆炸” 方法即可,东哥平时喜欢叫它爆炸。其实,这个和hive 中的lateral view explode 有异曲同工的效果,也就是 “列转行” 的功能。仍用上面这个例子,要达到想要的效果,只需要这么做。 df.explode('爱好')
二、explode不能直接处理的explode 这个爆炸方法只能处理列表 、元组 、Series 和numpy 的ndarray 的类型。Series.str.split() 分割字符串的方法来创建列表。df['爱好'] = df['爱好'].str.split() 然后,我们再用 |
|
来自: zZ华 > 《pandas和numpy》