Выборка R на основе распределения входного вектора

У меня есть вектор чисел, называемый данными, длиной 3205.

head(data,20)
 [1]  225.43200   29.20875  329.46792   22.70996
 [5]   80.84970  374.23959  343.11610  319.04798
 [9] 2477.73200   72.79434   30.53376   92.39412
[13]   47.70744   52.30388  339.59634 1177.00448
[17]   48.27329  541.80997   38.45772 1568.93400

График плотности этих данных выглядит следующим образом:

plot(density(data))

Я хотел бы случайным образом выбрать число с учетом распределения этого вектора. В большинстве случаев выбранное число будет меньше 1000, но есть также небольшой шанс, что оно будет 1000-3000, и если бы мы построили график плотности результирующего выборочного вектора, он в конечном итоге выглядел бы так же, как этот график плотности. Как лучше всего это сделать?

Этот вопрос является дубликатом.

— 27.11.2022 11:33

Интересный. Не уверен, что есть способ извлечь необходимую информацию из самого объекта плотности. Но что вы могли бы сделать, так это определить произвольное количество точек среза/разрыва вашего вектора (например, разделить диапазон на 100 групп), подсчитать, сколько значений находится в каждой группе, разделить это на общее количество точек данных и использовать это информация как аргумент вероятности в выборочной функции R. Введенный вектор будет диапазоном чисел в каждой группе.

— 27.11.2022 11:34

r simulation

27.11.2022 11:21

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Принятый ответ в ссылке Stackoverflow, приведенной в комментарии, предлагает использовать эмпирический cdf для выполнения метода обратной выборки. Это правильно, но есть самый простой способ добиться того же результата: просто выбрать несколько элементов из вектора наугад с заменой.

Другая возможность — взять образец из непрерывного дистрибутива, подходящего для дистрибутива вашего вектора, используя пакет kde1d:

library(kde1d)
fit <- kde1d(data)
simulations <- rkde1d(1000, fit)

27.11.2022 11:44

Другие вопросы по теме

В паллетной стеллаже хранения нет пустой ячейки Ошибка в AnyLogic

Как смоделировать случайный процесс, пока все элементы пути не станут положительными?

SFML движущийся спрайт по случайным фиксированным путям

Моделирование линейной регрессии scikit-learn python

Как сделать симуляцию без цикла?

ЖК-дисплей не работает в смоделированной среде

Симулируйте несбалансированные кластеризованные данные

Можно ли запустить omnet быстрее, чем экспресс-режим?

Нет средств обнаружения столкновений на прикладном уровне? Хм

Вероятность дерева моделирования Python

Выборка R на основе распределения входного вектора

Ответы 1

Другие вопросы по теме

Похожие вопросы