Чтобы улучшить мой вопрос
Как проверить, одинаковые ли Cntr_No и Total_Amount
HLBU 1234567 и 100 дублируются.
данные:
df1 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
df2 = pd.DataFrame({'Cntr_No': ['HLBU 1234567','HLBU 1234567'], 'Total_Amount': [100,100]})
выход:
Cntr_No Total_Amount Duplicate
0 HLBU 1234567 100 Yes
1 HLBU 1234567 100 Yes
Я пытаюсь создать столбец, чтобы указать, дублирует ли он «Да» или «Нет»
Вы получили на это ответ? Вы пробовали что-то вроде df1['Duplicate'] = df1.duplicated(keep=False).map({True:'Yes', False:'No'})
@prabhakar спасибо, что тоже работает!
Вы можете использовать pd.DataFrame.duplicated
, чтобы получить повторяющиеся строки как серию. Ключевое слово keep = False
пометит все дубликаты как True. Затем карта переименует значения Истина / Ложь в Да / Нет.
df1['Duplicate'] = df1.duplicated(keep=False).map({True:'Yes', False:'No'})
не совсем то, чего я хочу достичь, если есть тысячи записей