Предположим, я хочу построить следующие данные, используя sns.kdeplot:
np.random.seed(42)
x = [np.random.randint(0, 10) for _ in range(10)]
x
[6, 3, 7, 4, 6, 9, 2, 6, 7, 4]
Но теперь вместо того, чтобы иметь каждое значение, предположим, что у меня есть вероятность каждого из них:
# y is a pd.Series
y
6 0.3
7 0.2
4 0.2
9 0.1
3 0.1
2 0.1
Можно ли построить kdeplot из этих вероятностей?
Я думаю, что Seaborn, вероятно, рассчитывает эти значения, и поэтому я думаю, что это возможно.
Отлично, я думаю, это работает. Мои исходные данные намного больше, я просто использовал этот небольшой набор данных в качестве примера! @мваском
Вы должны быть в состоянии сделать это с помощью параметра weights kdeplot (добавлен в v0.11.0), что-то вроде
sns.kdeplot(x=x, weights=y)
Существует параметр weights (в v0.11.0+), который может быть полезен, но я не совсем уверен, что вы ищете с «сборкой kdeplot из этих вероятностей». В общем, я бы сказал, что график KDE не является хорошим подходом для визуализации распределения переменной, которая принимает небольшое количество дискретных значений.