У меня есть фрейм данных, например
import pandas as pd
A = ['x' , 'x', 'y', 'y', 'y']
B = [1, 3, 2, 1, 4]
C = [2, 3, 7, 2, 1]
df = pd.DataFrame({'A' : A, 'B' : B, 'C' : C })
df
и, к сожалению, я не мог выполнить этот расчет для каждой группы после df.groupby(['A'])
: умножить B
по элементам на C
элементы, просуммировать их и разделить на сумму элементов B
, и так получается следующее:
df1 = pd.DataFrame({'A' : ['x', 'y'], '(B*C)/B' : [(1*2 + 3*3)/(1+3) , (2*7+1*2+4*1)/(2+1+4)]})
df1
Вы можете сделать apply
:
df.groupby('A').apply(lambda x: (x['B']*x['C']).sum()/x['B'].sum())
Или аналогично:
df.groupby('A').apply(lambda x: np.average(x['C'],weights=x['B']) )
Выход:
A
x 2.750000
y 2.857143
dtype: float64