У меня есть pandas DataFrame, который содержит 1 и 0 в своих строках. Я хочу подсчитать количество групп последовательных 1 в моем DataFrame. Повторяю, я не прошу количество последовательных единиц, в Интернете есть много примеров по этому поводу.
Чтобы быть более точным:
Допустим, строка моего pd.DataFrame:
index value
0 0
1 1
2 1
3 0
4 0
5 1
6 0
7 1
8 0
9 1
Я хочу, чтобы вывод был 4
Преобразуйте значение в list , а затем выполните следующие действия: Это из моей головы, вы, вероятно, можете найти более эффективные способы сделать это.
Countconsecutiveone=0
i=0
prv_is_one=0
While i<len(Newlist):
if Newlist[i]==1 and prv_is_one==0:
Countconsecutiveone+=1
prv_is_one=1
elif Newlist[i]==0 and prv_is_one==1:
prv_is_one=0
i+=1
Возможно, вы могли бы использовать itertools.groupby:
>>> import pandas as pd
>>> from itertools import groupby
>>> d = {'value': [0, 1, 1, 0, 0, 1, 0, 1, 0, 1]}
>>> df = pd.DataFrame(data=d)
>>> df
value
0 0
1 1
2 1
3 0
4 0
5 1
6 0
7 1
8 0
9 1
>>> sum(k for k, _ in groupby(df['value']))
4
В качестве альтернативы, если ключ может быть чем-то другим, кроме 0
/1
, или вы хотите быть более явным:
>>> sum(1 for k, _ in groupby(df['value']) if k == 1)
4
Было бы здорово, если бы вы также могли объяснить, что делает строка кода. Я немного новичок в Python, и синтаксис, который вы используете, немного чужд мне.
Я использовал нечто, называемое пониманием, документы гораздо лучше объясняют, что они из себя представляют, чем я мог бы. Точно так же не забудьте нажать на ссылку itertools.groupby
выше. Наконец, если это не поможет, вы также можете поискать дополнительные ресурсы/объяснения на YouTube/Google/DuckDuckGo/Bing.
пытаться:
Работает только тогда, когда у вас нет 1 в начале или в конце.
df['value'].diff().eq(1).sum()
добавить 0 сверху и снизу ряда:
pd.concat([pd.Series([0]), df.value, pd.Series([0])]).diff().eq(1).sum()
4
Большое спасибо ! Он точно работает так, как задумано