Я пытаюсь работать со шрифтом Dask
и GeoPandas
Geometry
. Я делаю следующее:
sampel = dd.from_pandas(geo_data['geometry'], npartitions=5)
и получите dask.dataframe.core.Series
, который выглядит так:
path_id
252107318 LINESTRING (12813.000 10472.000, 13249.000 109...
252133674 LINESTRING (18662.000 103630.000, 17879.000 10...
252133710 LINESTRING (12374.000 103503.000, 12787.000 10...
252134520 LINESTRING (91560.000 102779.000, 91372.000 10...
252134720 LINESTRING (136141.000 105360.000, 136353.000 ...
Name: geometry, dtype: geometry
Я пытаюсь преобразовать Linestrings
в JSON
файл, но когда делаю что-то вроде этого:
sampel.map_partitions(lambda df: df.apply(lambda el: myfunc(el))).compute(scheduler='processes')
Я получаю сообщение об ошибке TypeError: Cannot interpret '<geopandas.array.GeometryDtype object as a data type
.
У кого-нибудь есть идея, как получить эту работу? Или просто невозможно работать с Geometry
типом dask
?
Спасибо :)
Ваш лучший способ использовать dask с GeoPandas — это проект dask-geopandas
, который заботится о типах данных и тому подобном. Он все еще находится на ранних стадиях разработки, но уже позволяет работать с DataFrame и геометрией. Подробнее см. https://github.com/jsignell/dask-geopandas.