Удаление столбца с использованием фрейма данных Dask

Это должно работать:

raw_data.drop('some_great_column', axis=1).compute()

Но столбец не уронили. В пандах я использую:

raw_data.drop(['some_great_column'], axis=1, inplace=True)

Но inplace не существует в Dask. Любые идеи?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
8
0
8 884
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Вы можете разделить на две операции:

# dask operation
raw_data = raw_data.drop('some_great_column', axis=1)

# conversion to pandas
df = raw_data.compute()

Затем экспортируйте фрейм данных Pandas в файл CSV:

df.to_csv(r'out.csv', index=False)

Я предполагаю, что преобразование в pandas потенциально не удастся из-за проблем с памятью ... причина, по которой я начал использовать Dask ...

cs0815 09.08.2018 16:54

Понятно, но это произойдет в любом случае, когда вы используете compute, даже в вашем исходном коде. В этом случае вы можете попробовать фильтровать и экспортировать по группам.

jpp 09.08.2018 16:54

Я предполагаю, что вы хотите хранить «сырые данные» в Dask DF. В этом случае поможет следующее:

new_raw_df = raw_data.drop('some_great_column', axis=1).copy()

где type(new_raw_df) - это dask.dataframe.core.DataFrame, и вы можете удалить исходный DF.

Другие вопросы по теме