Я могу записать на диск массивный фрейм данных dask следующим образом:
raw_data.to_csv(r'C:\Bla\SubFolder\*.csv')
Это создает фрагментированные данные исходного (обработанного) набора данных во вложенной папке:
C:\Bla\SubFolder\
Просто интересно, можно ли заставить dask записывать данные в один файл?
@MRocklin спасибо, но действительно ли это решение? написать все по частям, а затем снова собрать все вместе?
Возможный дубликат Запись разделов Dask в один файл