Я использую rnorm()
, но вместо того, чтобы заменять количество симуляций n
всего одной переменной, я хотел бы сделать это несколько раз с n
, имея заранее определенные значения из серии значений. (В моем проекте мне нужно будет сделать это более 11 600 раз, поскольку существует более 11 600 заранее определенных значений, для которых мне нужно использовать rnorm()
, но среднее и стандартное отклонение будут постоянными. Чтобы упростить все это обсуждение, я просто предположу, что У меня есть 10 заранее определенных значений, обозначающих количество симуляций, которые я хотел бы провести.)
unit.cost <- rnorm(n=728, mean = 8403.86, sd = 1000)
Вместо того, чтобы просто использовать «728» в качестве количества симуляций (n
), я бы хотел автоматически итеративно заменить, используя следующие серии значений: 728, 628, 100, 150, 99, 867, 934, 11, 67, 753
. (Я также хочу использовать эти серии значений в том же порядке, а не просто в случайном порядке, поскольку ожидаемым результатом должен быть фрейм данных, в котором указан unit.cost с использованием заранее определенных значений n. Обратите внимание, что оба mean
и sd
являются постоянный.)
При поиске выяснилось, что цикл for
будет идеальным кандидатом для этой настройки?
Может быть трудно ожидать, что фрейм данных будет содержать результаты, поскольку значения «n» различаются.
@Эдвард: Я не согласен. См. ответ PGSA или Carls ниже. Даже без суммирования результаты могут быть возвращены в виде списка списков (каждый из которых содержит записи для n и вектора значений, или в виде фрейма данных со столбцами для итерации, n и значения.
используя lapply()
, мы применяем одну и ту же функцию к каждому элементу вашего вектора, а затем возвращаем результаты в виде списка (отсюда и l
из lapply
).
rnorm
принимает аргументы rnorm(n, mean = 0, sd = 1)
— мы хотим, чтобы ваш вектор значений заполнил аргумент n
, поэтому мы указываем mean
и sd
:
nstouse <- c(728, 628, 100, 150, 99, 867, 934, 11, 67, 753)
nsout <- lapply(nstouse, rnorm, mean = 8403.86, sd = 1000)
дает:
> str(nsout)
List of 10
$ : num [1:728] 9168 8497 7782 6304 8711 ...
$ : num [1:628] 7709 6477 9047 7756 9781 ...
$ : num [1:100] 9761 7519 8675 8413 9376 ...
$ : num [1:150] 8378 9830 6052 7293 9908 ...
$ : num [1:99] 7074 8290 8287 10091 10256 ...
$ : num [1:867] 8034 9261 9053 8760 10571 ...
$ : num [1:934] 9351 8425 8199 7613 9412 ...
$ : num [1:11] 8540 7392 8925 8540 8259 ...
$ : num [1:67] 8366 7445 9361 9586 7632 ...
$ : num [1:753] 8637 8854 8402 6992 8878 ...
дальнейший запрос средств. Я представлю их во фрейме данных:
dfout <- data.frame(n = nstouse,
mean = sapply(nsout, mean))
дает
n mean
1 728 8362.516
2 628 8404.694
3 100 8536.995
4 150 8566.984
5 99 8428.155
6 867 8373.285
7 934 8388.744
8 11 8356.367
9 67 8612.405
10 753 8406.939
Спасибо, ПГСА. Просто вопрос: если я хочу получить среднее значение для каждой строки, есть ли способ сделать это, вернув список средних значений для каждой строки? Спасибо.
@ArvinHadlos да, это относительно просто - см. редактирование моего ответа. Я структурировал его как фрейм данных, но, надеюсь, будет относительно ясно, как при необходимости использовать его в виде списка.
Чтобы получить на выходе фрейм данных, включая используемый параметр n
, вы можете сделать следующее:
library(tidyverse)
param_n <- c(728, 628, 100, 150, 99, 867, 934, 11, 67, 753)
set.seed(1)
cost_df <- map(param_n, \(param_n){
tibble(
param_n,
unit_cost = rnorm(param_n, mean = 8403.86, sd = 1000)
)
}) |>
bind_rows()
cost_df
#> # A tibble: 4,337 × 2
#> param_n unit_cost
#> <dbl> <dbl>
#> 1 728 7777.
#> 2 728 8588.
#> 3 728 7568.
#> 4 728 9999.
#> 5 728 8733.
#> 6 728 7583.
#> 7 728 8891.
#> 8 728 9142.
#> 9 728 8980.
#> 10 728 8098.
#> # ℹ 4,327 more rows
Created on 2024-04-22 with reprex v2.1.0
Добро пожаловать в Stack Overflow! Кажется, это отличный вариант использования
lapply()
. Если ваш векторn
s называлсяnstouse
, то что-то вродеnsout <- lapply(nstouse, rnorm, mean = 8403.86, sd = 1000)