Объединить значения столбца с предыдущей строкой, если в другом столбце той же строки есть null

У меня есть такой фрейм данных,

df:

col1      col2       col3
 1        cat          4
nan       dog         nan 
 3        tiger         3
 2        lion          9
 nan      frog         nan
 nan     elephant      nan

Я хочу создать фрейм данных из этого фрейма данных, в котором id есть значения nan в col1, значения col2 будут добавлены к предыдущему значению строки.

например, желаемый кадр выходных данных будет:

col1     col2             col3
 1      catdog             4
 3       tiger             3
 2     lionfrogelephant    9

Как это сделать с помощью панд?

Как работает мое решение?

— 09.01.2019 11:22

да спасибо работаю

— 09.01.2019 11:28

Спасибо, что приняли!

— 09.01.2019 11:29

python pandas dataframe

08.01.2019 12:20

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Используйте прямое заполнение пропущенных значений и совокупный join:

cols = ['col1','col3']
df[cols] = df[cols].ffill()
df = df.groupby(cols)['col2'].apply(''.join).reset_index()
print (df)
   col1  col3              col2
0   1.0   4.0            catdog
1   2.0   9.0  lionfrogelephant
2   3.0   3.0             tiger

Или, при необходимости, заполнить пропущенные значения во всех столбцах:

df = df.ffill().groupby(['col1','col3'])['col2'].apply(''.join).reset_index()
print (df)
   col1  col3              col2
0   1.0   4.0            catdog
1   2.0   9.0  lionfrogelephant
2   3.0   3.0             tiger

08.01.2019 12:22

Другие вопросы по теме

Как мне получить первое не "Другое" на метке с несколькими столбцами

Сгруппируйте и разделите столбец даты по месяцам в пандах

ValueError при использовании sklearn.linear_model.LinearRegression в Python

KeyError при индексировании на MultiIndex DataFrame pandas

Постройте линейный график для производительности функций Pandas Query и Eval

Pandas - группировать, чтобы возвращать первое вхождение и каждое третье вхождение значения

Нарезка фрейма данных pandas дает разные результаты

Повторить определенное значение диапазона в столбце и отобразить во фрейме данных

Группировать и сводить списки

Как я могу объединить 2 фрейма данных на основе списка кортежей, где каждый кортеж содержит соответствующий ключ от каждого фрейма данных?

Объединить значения столбца с предыдущей строкой, если в другом столбце той же строки есть null

Ответы 1

Другие вопросы по теме

Похожие вопросы