Мне интересно, как воспроизвести следующий рисунок с помощью R.
Данные, используемые на рисунке, представляют собой разрозненные функциональные данные минеральной плотности костей. В основном уровень минералов в костях каждого участника измеряется несколько раз в течение эксперимента. Но время наблюдения и количество наблюдений у каждого участника разные.
Рисунок взят из статьи «Модели основных компонентов для разреженных функциональных данных». Вы можете найти его здесь Модели главных компонентов для разреженных функциональных данных или Модели главных компонентов для разреженных функциональных данных
Вы можете воспроизвести рисунок с выдуманными данными следующим образом:
library(ggplot2)
# Create sample data
set.seed(8) # Makes data reproducible
ages <- runif(40, 8, 24)
df <- do.call(rbind, lapply(seq_along(ages), function(x) {
age <- ages[x] + cumsum(runif(sample(2:5, 1), 1, 2))
y <- (tanh((age - 10)/pi - pi/2) + 2.5)/3
y <- y + rnorm(1, 0, 0.1)
y <- y + cumsum(rnorm(length(y), 0, 0.02))
data.frame(ID = x, age = age, BMD = y)
}))
# Draw plot
ggplot(df, aes(x = age, y = BMD)) +
geom_path(aes(group = ID), color = 'gray70', na.rm = TRUE) +
geom_point(color = 'gray70', na.rm = TRUE) +
geom_smooth(color = 'black', se = FALSE, formula =y ~ s(x, bs = "cs"),
method = 'gam', na.rm = TRUE) +
theme_classic(base_size = 16) +
scale_x_continuous(limits = c(8, 28)) +
labs(y = 'Spinal Bone Density', x = 'Age') +
theme(panel.border = element_rect(fill = NA))
Однако, не зная вашей собственной структуры данных, трудно сказать, насколько это применимо к вашему собственному варианту использования.
Вы можете сделать это в ggplot2
, если у вас есть данные в длинном формате и с переменной группировки, такой как id
в моем примере:
dat <- tibble::tribble(
~id, ~age, ~bone_dens,
1, 10, 0.6,
1, 15, 0.8,
1, 19, 1.12,
2, 11, 0.7,
2, 18, 1.1,
3, 16, 1.1,
3, 18, 1.2,
3, 25, 1.0)
Сначала вы рисуете точки с помощью geom_point()
, затем добавляете линии, соединяющие точки с одинаковым идентификатором, с помощью geom_line()
:
dat |>
ggplot(aes(x = age, y = bone_dens)) +
geom_point() +
geom_line(aes(group = id))
Вывод будет выглядеть так — вы сможете настроить его, как и любой другой ggplot.
Создание этих графиков в R, безусловно, возможно, но без каких-либо тестовых данных вы просите нас уделить много времени настройке, прежде чем мы сможем начать отвечать на ваш фактический вопрос. Пожалуйста, помогите нам помочь вам, предоставив минимальный воспроизводимый пример. Эта почта может помочь.