Мне нужно получить строки, содержащие точное значение столбца cat
и lion
и значение столбца, содержащее saurus
Для точного совпадения я знаю это
# Get indexes where column has cat and lion
indexNames = df[(df['start'] != 'cat') & (df['end'] != 'lion')].index
# Delete these row indexes from dataFrame
df = df.drop(indexNames)
Для частичного совпадения строк я делаю
// look for rows that contain column values consisting of saurus
df = df[df['type'].str.contains('saurus')]
Как мне объединить два вышеуказанных, чтобы получить комбинацию точных и частичных совпадений?
Примечание. Я ищу точные строки, соответствующие указанным выше критериям.
cat lion dinosaurus
cat lion tyrannosaurus
И не
bobcat lion dinosaurus
cat molion tyrannosaurus
@DaniMesejo добавил примечание. Пожалуйста, проверьте сейчас.
Если вам нужно их сохранить, почему первый код удаляет строки?
Я в замешательстве, где лев во всем этом? Как я уже сказал, лучше, если вы объясните на полных думмных примерах, охватывающих все случаи,
@DaniMesejo Мне очень жаль. Я переключался между двумя разными кодами, поэтому по ошибке добавил неправильные примеры. Извини за это.
@SouvikRay Не нужно извиняться, просто добавьте свои примеры, чтобы люди могли легко вам помочь :)
Я всегда с подозрением отношусь к использованию drop
. На самом деле в этом нет ничего плохого, но, как часто бывает в Python, мне проще управлять, сохраняя то, что вы хотите, а не отбрасывая его (например: [k for k in lst if wanted(k)]
, то же самое для dicts
и т. д.).
Итак, для вашего случая, как насчет:
mask = (df['start'] == 'cat') & (df['end'] == 'lion') & df['type'].str.contains('saurus')
df = df[mask]
Что вы имеете в виду под комбинацией? Пожалуйста, добавьте ввод и ожидаемый результат.