Я хочу прочитать большой zarr
файл с моего сервера minio(s3), однако после того, как я изменил три метода, все они вышли из строя:
import hydrodata.configs.config as conf
# Method 1
# https://pastebin.com/vkM1M3VV
zarr_path = await conf.FS.open_async('s3://datasets-origin/usgs_streamflow_nldas_hourly.zarr')
zds = xr.open_dataset(zarr_path, engine='zarr')
# Method 2
# https://pastebin.com/fKKECf3U
zarr_path = conf.FS.get_mapper('s3://datasets-origin/usgs_streamflow_nldas_hourly.zarr')
wrapped_store = zarr.storage.KVStore(zarr_path)
zds = xr.open_zarr(wrapped_store)
# Method 3
# AttributeError: __enter__
with conf.FS.open_async('s3://datasets-origin/usgs_streamflow_nldas_hourly.zarr') as zarr_path:
zds = xr.open_dataset(zarr_path)
А это conf.FS
:
FS = s3fs.S3FileSystem(
client_kwargs = {"endpoint_url": MINIO_PARAM["endpoint_url"]},
key=MINIO_PARAM["key"],
secret=MINIO_PARAM["secret"],
use_ssl=False,
)
Так как же решить их проблему и позволить мне получить правильные данные?
———————————————————————————————————
Это мой отчет о сбое в методе 2:
name = 'xarray.core.daskmanager'
import_ = <function _gcd_import at 0x7fe2aabbb400>
> ???
E ModuleNotFoundError: No module named 'xarray.core.daskmanager'
Однако я уже запускал pip install xarray[complete]
и conda install -c conda-forge xarray dask netCDF4 bottleneck
раньше, так в чем же проблема?
Это мой список пипов: https://pastebin.com/BUbcNqtT
Я обновил свой вопрос. «ModuleNotFoundError: нет модуля с именем xarray.core.daskmanager», однако до этого я запускал pip install xarray[complete]
.
Пожалуйста, вставьте свое исключение и полную обратную связь в вопрос. Так что к s3fs это не имеет никакого отношения. Пожалуйста, удалите все это и спросите только о xarray-dask.
Я переделал эту практику на другом компьютере и наконец обнаружил, что эту проблему невозможно воспроизвести. Теперь мне следует закрыть проблему.
Метод 2 — единственный, который должен работать: пожалуйста, покажите, что именно пошло не так.