Pandas: Grouped DataFrame — разделить значения столбца на значение определенной строки в этом столбце для каждой группы

У меня есть датафрейм с группами. Чтобы нормализовать значения для каждой группы, я хотел бы разделить все значения каждой группы на значение определенного элемента в этой группе.

df = pd.DataFrame([['a','2018-02-03',42],
                   ['a','2018-02-04',22],
                   ['a','2018-02-05',10],
                   ['a','2018-02-06',32],
                   ['b','2018-02-03',10],
                   ['b','2018-02-04',8],
                   ['b','2018-02-05',2],
                   ['b','2018-02-06',12],
                   ['c','2018-02-03',20],
                   ['c','2018-02-04',30],
                   ['c','2018-02-05',5],
                   ['c','2018-02-06',15]])
df.columns = ['product','day','value']

Я хочу нормализовать «значение» столбца для каждого «продукта» по «значению» «дня» == «2018-02-05»

Ожидаемый результат:

    product     day         value
0   a           2018-02-03  4.2
1   a           2018-02-04  2.2
2   a           2018-02-05  1
3   a           2018-02-06  3.2
5   b           2018-02-03  5
6   b           2018-02-04  4
7   b           2018-02-05  1
8   b           2018-02-06  6
10  c           2018-02-03  4
11  c           2018-02-04  6
12  c           2018-02-05  1
13  c           2018-02-06  3

Я пытался df.groupby('product').transform().
Доступ к первому значению .transform('first') возможен. Но я не могу найти способ получить доступ к определенному значению.

Аннотация: Может быть, это можно решить без использования .groupby()?

pandas dataframe group-by transform normalize

14.03.2019 19:55

Learning Data Analytics Two: Filtering data in a DataFrame

В Learning Data Analytics One: Using Python and Pandas , я рассказываю о:

Сиборн не любит даты: вместо них используются ординалы дат

1 869

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Делайте так:

df = pd.DataFrame([['a','2018-02-03',42],
                   ['a','2018-02-04',22],
                   ['a','2018-02-05',10],
                   ['a','2018-02-06',32],
                   ['b','2018-02-03',10],
                   ['b','2018-02-04',8],
                   ['b','2018-02-05',2],
                   ['b','2018-02-06',12],
                   ['c','2018-02-03',20],
                   ['c','2018-02-04',30],
                   ['c','2018-02-05',5],
                   ['c','2018-02-06',15]])
df.columns = ['product','day','value']

date = '2018-02-05'

# Set the index to ['product', 'day']
df.set_index(['product', 'day'], inplace=True)

# Helper Series - Values of date at index 'day'
s = df.xs(date, level=1)

# Divide df by helper Series and reset index
df = df.div(s, level=0).reset_index()
print(df)

   product         day  value
0        a  2018-02-03    4.2
1        a  2018-02-04    2.2
2        a  2018-02-05    1.0
3        a  2018-02-06    3.2
4        b  2018-02-03    5.0
5        b  2018-02-04    4.0
6        b  2018-02-05    1.0
7        b  2018-02-06    6.0
8        c  2018-02-03    4.0
9        c  2018-02-04    6.0
10       c  2018-02-05    1.0
11       c  2018-02-06    3.0

14.03.2019 20:26

Другие вопросы по теме

Неподдерживаемые типы операндов для +: 'int' и 'str' с использованием значения Pandas

Как суммировать данные в определенные периоды времени в Pandas?

Испытывает трудности с пониманием работы этой части кода

Удаление строк из df, содержащих одинаковую комбинацию двух столбцов

Преобразование списка во фрейм данных [проблемы]

Как присвоить значения из столбца 1 столбцу 2, когда столбец 1 > 0, а столбец 2 <= 0

Фрейм данных pandas, группировка, скользящее окно, затем статистика

PySpark: объединение всех фреймов данных в словаре Python

Сохранение словаря фреймов данных в виде отдельного файла .csv

Почему этот код не проходит через серию и не заменяет значения?

Pandas: Grouped DataFrame — разделить значения столбца на значение определенной строки в этом столбце для каждой группы

Ответы 1

Другие вопросы по теме

Похожие вопросы