В пакете xarray
python можно уменьшить данные DataArray, применив функцию по некоторому измерению (чаще всего по измерению времени). Встроенные функции включают, среди прочего, среднее, минимальное и максимальное значения. То есть:
DataArray.mean(dim = 'time')
DataArray.min(dim = 'time')
DataArray.max(dim = 'time')
Насколько я вижу, нет встроенного способа вычислить моду таким же образом. Есть ли способ сделать это иначе, например, с помощью других пакетов?
То есть некоторая функция, которая была бы эквивалентна:
DataArray.mode(dim = 'time')
Вы можете обернуть функцию режима Scipy, используя Xarray apply_ufunc
. Дополнительные примеры использования apply_ufunc
можно найти здесь.
def _mode(*args, **kwargs):
vals = scipy.stats.mode(*args, **kwargs)
# only return the mode (discard the count)
return vals[0].squeeze()
def mode(obj, None):
# note: apply always moves core dimensions to the end
# usually axis is simply -1 but scipy's mode function doesn't seem to like that
# this means that this version will only work for DataArray's (not Datasets)
assert isinstance(obj, xr.DataArray)
axis = obj.ndim - 1
return xr.apply_ufunc(_mode, obj,
input_core_dims=[[dim]],
kwargs = {'axis': axis})
Быстрый пример использования учебных наборов данных xarray:
ds = xr.tutorial.load_dataset('air_temperature')
mode(ds, dim='time')
дает:
<xarray.Dataset>
Dimensions: (lat: 25, lon: 53)
Coordinates:
* lat (lat) float32 75.0 72.5 70.0 67.5 65.0 ... 25.0 22.5 20.0 17.5 15.0
* lon (lon) float32 200.0 202.5 205.0 207.5 ... 322.5 325.0 327.5 330.0
Data variables:
air (lat, lon) float32 271.5 272.4 272.5 272.1 ... 296.9 296.9 296.79