Сводной фрейм данных с повторяющимися значениями

рассмотрите ниже pd.DataFrame

temp = pd.DataFrame({'label_0':[1,1,1,2,2,2],'label_1':['a','b','c',np.nan,'c','b'], 'values':[0,2,4,np.nan,8,5]})

print(temp)
        label_0 label_1 values
    0   1           a   0.0
    1   1           b   2.0
    2   1           c   4.0
    3   2          NaN  NaN
    4   2           c   8.0
    5   2           b   5.0

мой желаемый результат

     label_1    1   2
  0     a      0.0  NaN
  1     b      2.0  5.0
  2     c      4.0  8.0
  3     NaN    NaN  NaN

Я пробовал pd.pivot и возился с pd.gropuby, но не могу получить желаемый результат из-за повторяющихся записей. любая помощь наиболее ценится.

python pandas group-by pivot

18.06.2019 23:34

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

Вы можете сделать fillna тогда pivot

temp.fillna('NaN').pivot(*temp.columns).T
Out[251]: 
label_0    1    2
label_1          
NaN      NaN  NaN
a          0  NaN
b          2    5
c          4    8

18.06.2019 23:36

Другой способ — использовать set_index и unstack:

temp.set_index(['label_0','label_1'])['values'].unstack(0)

Выход:

label_0    1    2
label_1          
NaN      NaN  NaN
a        0.0  NaN
b        2.0  5.0
c        4.0  8.0

18.06.2019 23:47

Ответ принят как подходящий

d = {}
for _0, _1, v in zip(*map(temp.get, temp)):
    d.setdefault(_1, {})[_0] = v

pd.DataFrame.from_dict(d, orient='index')

       1    2
a    0.0  NaN
b    2.0  5.0
c    4.0  8.0
NaN  NaN  NaN

ИЛИ

pd.DataFrame.from_dict(d, orient='index').rename_axis('label_1').reset_index()

  label_1    1    2
0       a  0.0  NaN
1       b  2.0  5.0
2       c  4.0  8.0
3     NaN  NaN  NaN

просто супер! благодаря тонну. вы и раньше мне не раз помогали.

— 19.06.2019 13:24

18.06.2019 23:47

Похоже, работает простой pivot:

temp.pivot(columns='label_0', index='label_1', values='values')

Выход:

label_0     1       2
label_1         
NaN         NaN     NaN
a           0.0     NaN
b           2.0     5.0
c           4.0     8.0

19.06.2019 02:18

Другие вопросы по теме

Сопоставить строки по значению идентификатора в python pandas

TypeError: ufunc add не может использовать операнды с типами dtype('<M8[ns]') и dtype('<M8[ns]')

Как извлечь значения из разных столбцов после группировки в пандах?

Установите один и тот же словарь для каждой ячейки Pandas

Вырезать слово из столбца и вставить в новый столбец

Как вы обрабатываете все файлы в папке?

Суммировать и добавить ввод 2 файлов с использованием python

Свести данные JSON с помощью pandas json_normalize

Добавьте столбец, используя вычисления с участием первого элемента группы значений

Pandas read_excel возвращает один столбец, заканчивающийся на .1

Сводной фрейм данных с повторяющимися значениями

Ответы 4

Другие вопросы по теме

Похожие вопросы