Итерация массива numpy для использования в словаре

У меня есть проект, в котором я пытаюсь обновить фрейм данных до нового набора изменений. В настоящее время в фрейме данных содержится 15 000 выборок данных, поэтому время выполнения может быстро стать проблемой. Я знаю, что векторизация фрейма данных с использованием numpy — это хороший способ сократить время выполнения, но у меня возникла проблема с моим массивом numpy и словарем.

Цель состоит в том, чтобы посмотреть значение в col3, использовать его в качестве ключа к df_dict и использовать значение этой словарной статьи для умножения на col2 и присвоения col1.

Я смог сделать это с помощью циклов for , но это привело к серьезной проблеме времени выполнения, особенно потому, что требуется больше шагов, чем просто то, о чем я прошу помощи.

d = {"col1": [1, 2, 3, 4], "col2": [1, 2, 3, 4], "col3": ["a","b","c","d"]}
df = pd.DataFrame(data=d)
df_dict = {"a":1.2,"b":1.5,"c":0.95,"d":1.25}

df["col1"]=df["col2"].values*df_dict[df["col3"].values]

Я ожидаю, что col1 будет обновлен до [1.2, 3, 2.85, 5], но вместо этого получаю сообщение об ошибке TypeError: unhashable type: 'numpy.ndarray'

Я понимаю, почему возникает ошибка, я просто хочу найти лучшую альтернативу.

df["col1"]=df["col2"]* [df_dict.get(i, 1) for i in df["col3"].values] ?

— 02.07.2019 15:10

Поиск в словаре должен выполняться один за другим.

— 02.07.2019 17:07

python pandas numpy dataframe

02.07.2019 15:07

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Похоже, вам нужно.

d = {"col1": [1, 2, 3, 4], "col2": [1, 2, 3, 4], "col3": ["a","b","c","d"]}
df = pd.DataFrame(data=d)
df_dict = {"a":1.2,"b":1.5,"c":0.95,"d":1.25}

df["col1"]=df["col2"]* [df_dict.get(i, 1) for i in df["col3"]]
print(df)

Выход:

   col1  col2 col3
0  1.20     1    a
1  3.00     2    b
2  2.85     3    c
3  5.00     4    d

Спасибо за ответ! это наиболее оптимизированный для времени выполнения способ, учитывая, что он все еще выполняет базовые циклы Python?

— 02.07.2019 15:14

02.07.2019 15:11

Ответ принят как подходящий

Вы можете использовать немного лучшее решение, используя .map.

Итак, замените:

df["col1"]=df["col2"].values*df_dict[df["col3"].values]

С участием:

df["col1"]=df["col2"] * df['col3'].map(df_dict)

Похоже, это map работает, сначала конвертируя словарь в серию, pd.Series(df_dict).

— 02.07.2019 18:01

02.07.2019 15:23

Другие вопросы по теме

Как суммировать второе значение во фрейме данных, состоящем из кортежей, и использовать вывод для создания нового столбца во фрейме данных

Объединить и объединить 2 столбца разных фреймов данных

Как удалить дубликаты, но сохранить строки, если конкретный другой столбец не равен нулю (Pandas)

Создайте новый меньший «под» DataFrameS на основе groupby, созданного на «корневом» Dataframe

Как построить таблицу (матрицу) с двумя списками и массивами данных?

Строки в столбцы на основе другого столбца, хорошо, вот и все

Как разделить столбец Pandas, содержащий значения, хранящиеся в виде текста и чисел, на два отдельных столбца

Получить список столбцов, в которых данные различаются для последовательных строк

Эквивалент Pandas numpy.lookfor

Как сгладить иерархию с помощью Pandas

Итерация массива numpy для использования в словаре

Ответы 2

Другие вопросы по теме

Похожие вопросы