Как запустить стратифицированную линейную регрессию с начальной загрузкой в ​​​​R?

В моей модели x — категориальная переменная с 3 категориями: 0,1 и 2, где 0 — эталонная категория. Однако 0 категорий больше, чем другие (1,2), поэтому, чтобы избежать предвзятой выборки, я хочу стратифицировать начальную загрузку, но не смог найти для этого подходящего метода.

df <- data.frame (x  = c(0,0,0,0,0,1,1,2,2),
                  y = c(10,11,10,10,12,17,16,20,19),
                  m = c(6,5,6,7,2,10,14,8,11)
                  )
df$x <- as.factor(df$x)
df$x <- relevel(df$x,ref = "0")


fit <- lm(y ~ x*m, data = df)

summary(fit)
library(boot); boot(df, \(DF, i) coef(lm(y ~ x*m, data = df[i,])), strata = df$x, R = 999)
Roland 17.05.2022 12:21

@Roland, а как я могу заставить LLCI ULCI определять значимость переменных?

George carrick 17.05.2022 12:42
help("boot.ci")
Roland 17.05.2022 12:54
Формы c голосовым вводом в React с помощью Speechly
Формы c голосовым вводом в React с помощью Speechly
Пытались ли вы когда-нибудь заполнить веб-форму в области электронной коммерции, которая требует много кликов и выбора? Вас попросят заполнить дату,...
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Будучи разработчиком веб-приложений, легко впасть в заблуждение, считая, что приложение без JavaScript не имеет права на жизнь. Нам становится удобно...
Flatpickr: простой модуль календаря для вашего приложения на React
Flatpickr: простой модуль календаря для вашего приложения на React
Если вы ищете пакет для быстрой интеграции календаря с выбором даты в ваше приложения, то библиотека Flatpickr отлично справится с этой задачей....
В чем разница между Promise и Observable?
В чем разница между Promise и Observable?
Разберитесь в этом вопросе, и вы значительно повысите уровень своей компетенции.
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Клиент для URL-адресов, cURL, позволяет взаимодействовать с множеством различных серверов по множеству различных протоколов с синтаксисом URL.
Четыре эффективных способа центрирования блочных элементов в CSS
Четыре эффективных способа центрирования блочных элементов в CSS
У каждого из нас бывали случаи, когда нам нужно отцентрировать блочный элемент, но мы не знаем, как это сделать. Даже если мы реализуем какой-то...
0
3
20
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Расширяя ответ Роланда в комментариях, вы можете получить доверительные интервалы от начальной загрузки, используя boot.ci:

library(boot)

b <- boot(df, \(DF, i) coef(lm(y ~ x*m, data = df[i,])), strata = df$x, R = 999)

result <- do.call(rbind, lapply(seq_along(b$t0), function(i) {
  m <- boot.ci(b, type = 'norm', index = i)$normal
  data.frame(estimate = b$t0[i], lower = m[2], upper = m[3])
  }))

result
#>               estimate      lower       upper
#> (Intercept) 12.9189189 10.7166127 15.08403731
#> x1           6.5810811  2.0162637  8.73184665
#> x2           9.7477477  6.9556841 11.37390826
#> m           -0.4459459 -0.8010925 -0.07451434
#> x1:m         0.1959459 -0.1842914  0.55627896
#> x2:m         0.1126126 -0.2572955  0.48352616

И даже построить результаты следующим образом:

ggplot(within(result, var <- rownames(result)), aes(estimate, var)) +
  geom_vline(xintercept = 0, color = 'gray') +
  geom_errorbarh(aes(xmin = lower, xmax = upper), height = 0.1) +
  geom_point(color = 'red') +
  theme_light()

enter image description here

Другие вопросы по теме