Репликация pandas to_dict в полярах

В pandas я могу сделать следующее, чтобы получить словарь ключ/значение из to_dict

d = [{'key':'a', 'value':1}, {'key':'b', 'value':2}, {'key':'b', 'value':1}]
df = pd.DataFrame(d)
df.groupby('key')['value'].sum().to_dict()
Out[13]: {'a': 1, 'b': 3}

Когда я пытаюсь воспроизвести это в полярах, я получаю следующее:

df = pl.DataFrame(d)
In [133]: df.groupby('key').agg(pl.col('value').sum()).to_dict(as_series=False)
Out[133]: {'key': ['a', 'b'], 'value': [1, 3]}

In [134]: df.groupby('key').agg(pl.col('value').sum()).transpose().to_dict(as_series=False)
Out[134]: {'column_0': ['b', '3'], 'column_1': ['a', '1']}

Хотя это технически правильно, распаковка этого в соответствии с тем, что pandas возвращает для большого фрейма данных, будет медленной. Как я могу сделать так, чтобы поляры возвращали тот же ключ/значение, что и приведенный выше фрагмент панды?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
0
64
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Использование .iter_rows()

dict(df.groupby('key').agg(pl.col('value').sum()).iter_rows())
{'a': 1, 'b': 3}

Что также можно записать с помощью GroupBy.sum() ref: @DeanMacGregor

dict(df.groupby('key').sum().iter_rows())

Второй кажется намного быстрее, первый почти такой же скорости, как панды

pyCthon 05.04.2023 17:39

Ах, приятно знать, это также довольно много печатать. Я обнаружил, что .iter_rows тоже работает, если вы хотите посмотреть, как это работает.

jqurious 05.04.2023 17:46

Хорошо, .iter_rows намного быстрее в моем локальном тестировании, поэтому я удалил предыдущие предложения.

jqurious 05.04.2023 18:05

Вы можете просто сделать df.groupby('key').sum(), если это фрейм данных, а не ленивый фрейм, чтобы сократить набор текста.

Dean MacGregor 05.04.2023 19:22

Спасибо @DeanMacGregor - похоже, есть и ленивая версия, ей просто нужен .collect() перед .iter_rows()

jqurious 05.04.2023 19:38

Nice .iter_rows() работает даже быстрее, чем предыдущая версия с использованием zip

pyCthon 07.04.2023 05:44

Другие вопросы по теме