Python - добавьте массив numpy в качестве столбца в фрейм данных pandas с разной длиной

У меня есть pandas dataframe df с несколькими столбцами. Один из столбцов - Col1, который содержит значения с плавающей запятой или NaN:

df
+----+------+-----+
| No | Col1 | ... |
+----+------+-----+
| 12 |   10 | ... |
| 23 |  NaN | ... |
| 34 |    5 | ... |
| 45 |  NaN | ... |
| 54 |   22 | ... |
+----+------+-----+

Я запускаю функцию через Col1, исключая пропущенные значения (NaN), например:

StandardScaler().fit_transform(df.loc[pd.notnull(df[Col1]), [Col1]])

Представьте, что результатом является такой numpy.ndarray:

+-----+
| Ref |
+-----+
|   2 |
|   5 |
|   1 |
+-----+

Обратите внимание, что этот массив не имеет той же длины, что и исходный столбец Col1.

Мне нужно решение добавить массив Ref в качестве столбца в df. Для каждой строки, где Col1 - это NaN, новый столбец Ref также получает NaN. Желаемый результат будет выглядеть так:

+----+------+-----+-----+
| No | Col1 | ... | Ref |
+----+------+-----+-----+
| 12 |   10 | ... |   2 |
| 23 |  NaN | ... | NaN |
| 34 |    5 | ... |   5 |
| 45 |  NaN | ... | NaN |
| 54 |   22 | ... |   1 |
+----+------+-----+-----+

python pandas numpy dataframe

14.06.2018 13:42

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

572

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Я думаю, вы можете назначить новый столбец, отфильтрованный по той же логической маске:

from sklearn.preprocessing import StandardScaler

mask = df['Col1'].notnull()
df.loc[mask, 'Ref'] = StandardScaler().fit_transform(df.loc[mask, ['Col1']])
print (df)
   No  Col1       Ref
0  12  10.0 -0.327089
1  23   NaN       NaN
2  34   5.0 -1.027992
3  45   NaN       NaN
4  54  22.0  1.355081

Деталь:

print (StandardScaler().fit_transform(df.loc[mask, ['Col1']]))
[[-0.32708852]
 [-1.02799249]
 [ 1.35508101]]

14.06.2018 13:46

Другие вопросы по теме

Как я могу отрегулировать этот индекс фрейма данных?

Зацикливание столбцов

Pandas wide_to_long, переменные id должны однозначно идентифицировать каждую строку

Как извлечь следующее с помощью панд или регулярного выражения

Доступ к строкам до и после интересующих строк в Pandas Dataframe

Именование переменной внутри цикла for в Python

Узнать значение конкретной переменной в Python

Панды создают флаг при слиянии двух фреймов данных

Pandas группирует по нескольким столбцам, суммирует и добавляет ответ как новый столбец в исходный фрейм данных

Создание нового столбца функций для сгруппированных данных в фрейме данных Pandas

Python - добавьте массив numpy в качестве столбца в фрейм данных pandas с разной длиной

Ответы 1

Другие вопросы по теме

Похожие вопросы