Как объединить строки в фрейме данных с разными столбцами?

Я хочу объединить строки фрейма данных с одним общим значением столбца, а затем объединить остальные значения столбца, разделенные запятой, для строковых значений и преобразовать в массив/список для значений int.

A   B     C    D
1  one   100  value
4  four  400  value
5  five  500  value
2  two   200  value

Ожидаемый результат, например:

   A                B                 C            D
[1,4,5,2]  one,four,five,two  [100,400,500,200]  value

Я могу использовать groupby для столбца D, но как я могу использовать apply для столбцов A, C как apply(np.array) и apply(','.join) для столбца B в df одновременно?

python pandas dataframe pandas-groupby

25.06.2019 07:27

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

209

Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Динамическое решение - строковые столбцы объединяются, а числовые преобразуются в списки с GroupBy.agg:

f = lambda x: x.tolist() if np.issubdtype(x.dtype, np.number) else ','.join(x)
#similar for test strings - https://stackoverflow.com/a/37727662
#f = lambda x: ','.join(x) if np.issubdtype(x.dtype, np.flexible) else x.tolist()
df1 = df.groupby('D').agg(f).reset_index().reindex(columns=df.columns)
print (df1)
              A                  B                     C      D
0  [1, 4, 5, 2]  one,four,five,two  [100, 400, 500, 200]  value

Другое решение - указать каждую функцию отдельно для каждого столбца:

df2 = (df.groupby('D')
        .agg({'A': lambda x: x.tolist(), 'B': ','.join, 'C':lambda x: x.tolist()})
        .reset_index()
        .reindex(columns=df.columns))

print (df2)

              A                  B                     C      D
0  [1, 4, 5, 2]  one,four,five,two  [100, 400, 500, 200]  value

25.06.2019 07:29

Ответ принят как подходящий

df = df.groupby('D').apply(lambda x: pd.Series([list(x.A),','.join(x.B),list(x.C)])).reset_index().rename({0:'A',1:'B',2:'C'}, axis=1)

df = df[['A','B','C','D']]

Выход

              A                  B                     C      D
0  [1, 4, 5, 2]  one,four,five,two  [100, 400, 500, 200]  value

25.06.2019 07:36

Почему бы не однострочник agg:

>>> df.groupby('D', as_index=False).agg(lambda x: x.tolist() if x.dtype != object else ','.join(x))[df.columns]
              A                  B                     C      D
0  [1, 4, 5, 2]  one,four,five,two  [100, 400, 500, 200]  value
>>>

25.06.2019 07:38

Другие вопросы по теме

Pandas: интерполяция временных рядов на сводном фрейме данных

Создан индекс на основе разных дат

Установите значение для столбца, если значение существует в другом DataFrame

Как рассчитать среднее с квартальным интервалом в течение года?

Одни и те же значения не меняются, но при использовании панд нужно объединять разные значения?

Как заполнить столбец в одном фрейме данных, сравнив его с другим фреймом данных

Glob.glob несколько фреймов данных для расчета добавления в пандах

Точечная диаграмма dataframe1 со стилем маркера, определяемым непрерывной переменной в dataframe2

Постройте переменное количество линий/кривых с боке

Сортировка фрейма данных pandas по группам

Как объединить строки в фрейме данных с разными столбцами?

Ответы 3

Другие вопросы по теме

Похожие вопросы