Я использую Python 3.9. Я пытаюсь разобрать этот файл CSV с 3 столбцами данных.
55,Fake ISD,SUCCESS
56,Other ISD,None
57,Third ISD,WARNING
58,Fourth ISD,FAILURE
59,Main ISD,SUCCESS
60,Secondary ISD,SUCCESS
Мне было интересно, есть ли какая-то готовая библиотека, которая будет анализировать CSV для агрегирования данных на основе результатов третьего столбца. То есть мне нужен отчет со списками
SUCCESS - 3 entries - Fake ISD, Main ISD, Secondary ISD
WARNING - 1 entry - Third ISD
FAILURE - 1 entry - Fourth ISD
None - 1 entry - Other ISD
Как мне объединить их в Python 3.9?
Подход, основанный на здравом смысле, состоял бы в том, чтобы использовать Pandas. В частности, посмотрите на DataFrame.groupby(). Вы найдете много учебного материала для этого.
Вы можете попробовать pandas
:
import pandas as pd
df = pd.read_csv("your_file.csv", header=None)
x = df.groupby(2)[1].agg(list)
for i, d in zip(x.index, x):
print(f'{i} - {len(d)} - {", ".join(d)}')
Отпечатки:
FAILURE - 1 - Fourth ISD
None - 1 - Other ISD
SUCCESS - 3 - Fake ISD, Main ISD, Secondary ISD
WARNING - 1 - Third ISD
Здесь не по теме запрашивать предложения библиотек. Ваш вопрос мог бы быть по теме, если бы вы перефразировали его, чтобы показать свою попытку достичь этого, и задали конкретный вопрос о реализации вместо того, чтобы просить рекомендацию для библиотеки. Прочтите Как спросить и контрольный список вопросов и предоставьте минимальный воспроизводимый пример, показывающий вашу конкретную проблему.