pandas - Groupby two functions( pandas -按两种功能分组)
本文介绍了 pandas -按两种功能分组的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我一直在试着从大 pandas 的Groupby物体上得到一个累加。我需要将累加移位1,这是通过Shift()实现的。但是,在单个GROUPBY对象上同时执行这两个函数会产生一些不需要的结果:
df = pd.DataFrame({'A': [1, 1, 1, 2, 2, 2],
'B': [2, 3, 5, 2, 3, 5]})
df.groupby('A').cumsum().shift()
这提供了:
B
0 NaN
1 2.0
2 5.0
3 10.0
4 2.0
5 5.0
即,组1上的Cumsum()的最后一个值被移位到组2的第一个值。我想要的是这些组保持分离,并获得:
B
0 NaN
1 2.0
2 5.0
3 NaN
4 2.0
5 5.0
但我不确定如何让这两个函数结合使用GROUPBY对象。在其他地方找不到这个问题。一直在玩弄阿格,但似乎解决不了问题。如有任何帮助,我们将不胜感激。
推荐答案
使用lambda function
WITHGroupBy.apply
,还需要在groupby
之后定义列表中的列进行处理:
df['B'] = df.groupby('A')['B'].apply(lambda x: x.cumsum().shift())
print (df)
A B
0 1 NaN
1 1 2.0
2 1 5.0
3 2 NaN
4 2 2.0
5 2 5.0
这篇关于 pandas -按两种功能分组的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
沃梦达教程
本文标题为:pandas -按两种功能分组


猜你喜欢
- python-m http.server 443--使用SSL? 2022-01-01
- 如何将一个类的函数分成多个文件? 2022-01-01
- 如何在 python3 中将 OrderedDict 转换为常规字典 2022-01-01
- 使用Heroku上托管的Selenium登录Instagram时,找不到元素';用户名'; 2022-01-01
- python check_output 失败,退出状态为 1,但 Popen 适用于相同的命令 2022-01-01
- 沿轴计算直方图 2022-01-01
- padding='same' 转换为 PyTorch padding=# 2022-01-01
- 分析异常:路径不存在:dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data; 2022-01-01
- 如何在 Python 的元组列表中对每个元组中的第一个值求和? 2022-01-01
- pytorch 中的自适应池是如何工作的? 2022-07-12