У меня есть следующий фрейм данных, который я группирую, чтобы получить мультииндексный фрейм данных:
In[33]: df = pd.DataFrame([[0, 'foo', 5], [0, 'foo', 7], [1, 'foo', 4], [1, 'bar', 5], [1, 'foo', 6], [1, 'bar', 2], [2, 'bar', 3]], columns=['id', 'foobar', 'A'])
In[34]: df
Out[34]:
id foobar A
0 0 foo 5
1 0 foo 7
2 1 foo 4
3 1 bar 5
4 1 foo 6
5 1 bar 2
6 2 bar 3
In[35]: df.groupby(['id', 'foobar']).size()
Out[35]:
id foobar
0 foo 2
1 bar 2
foo 2
2 bar 1
dtype: int64
Я хочу получить строки в «id», где количество «foo»> = 2 И количество «bar»> = 2, поэтому в основном получаем:
foobar A
id
1 bar 2
foo 2
Но я немного не понимаю, как мне сформулировать эти условия с помощью мультииндекса?
edit: это не является избыточным с Как фильтровать даты в мультииндексном фрейме данных, поскольку я не работаю с датами, и мне нужны условия для количества конкретных значений в моем Dataframe.






Используя all после unstack, затем выберите тот, который вам нужен, stack обратно
new=df.groupby(['id', 'foobar']).size().unstack(fill_value=0)
new[new.ge(2).all(1)].stack()
id foobar
1 bar 2
foo 2
dtype: int64
Возможный дубликат Как фильтровать даты в мультииндексном фрейме данных