Предположим, у меня есть следующий фрейм данных:
A B C D E F
1 1 1 0 0 0
0 0 0 0 0 0
1 1 0.9 1 0 0
0 0 0 0 -1.95 0
0 0 0 0 2.75 0
1 1 1 1 1 1
Я хочу выбрать строки, в которых есть только нули, а также единицы (0 & 1
) на основе столбцов C, D, E and F
. Для этого примера ожидаемый результат
A B C D E F
1 1 1 0 0 0
Как я могу сделать это с учетом диапазона столбцов в пандах?
Заранее спасибо.
@ Пол Бреннан, да. Вы поняли, чего я хочу.
Давайте попробуем логическое индексирование с помощью loc
для фильтрации строк:
c = ['C', 'D', 'E', 'F']
df.loc[df[c].isin([0, 1]).all(1) & df[c].eq(0).any(1) & df[c].eq(1).any(1)]
Результат:
A B C D E F
0 1 1 1.0 0 0.0 0
Попробуйте apply
и loc
:
print(df.loc[df.apply(lambda x: sorted(x.drop_duplicates().tolist()) == [0, 1], axis=1)])
Выход:
A B C D E F
0 1 1 1.0 0 0.0 0
Таким образом, проверка будет состоять как минимум из одной единицы и хотя бы из одного нуля в столбцах C, D, E и F, но ничего, кроме единицы или нуля?