Как я могу масштабировать/нормализовать свои данные в каждой строке (Наблюдения)? Что-то вроде [-1:1] как счет z?
Я видел предыдущий пост, который включает нормализацию всего набора данных, как это https://stats.stackexchange.com/questions/178626/how-to-normalize-data-between-1-and-1 , но я бы хотел нормализовать каждую строку, чтобы их можно было отобразить на одной и той же блочной диаграмме, поскольку все они показывают один и тот же шаблон по оси X.
Obs <- c("A", "B", "C")
count1 <- c(100,15,3)
count2 <- c(250, 30, 5)
count3 <- c(290, 20, 8)
count4<- c(80,12, 2 )
df <- data.frame(Obs, count1, count2, count3, count4)
dff<- df %>% pivot_longer(cols = !Obs, names_to = 'count', values_to = 'Value')
ggplot(dff, aes(x = count, y = Value)) +
geom_jitter(alpha = 0.1, color = "tomato") +
geom_boxplot()
Основываясь на ссылке, которой вы поделились, вы можете использовать apply
, чтобы использовать соответствующую функцию для масштабирования фрейма данных на [-1,1].
library(scales)
library(ggplot2)
library(tidyr)
Obs <- c("A", "B", "C")
count1 <- c(100,15,3)
count2 <- c(250, 30, 5)
count3 <- c(290, 20, 8)
count4<- c(80,12, 2 )
df <- data.frame(count1, count2, count3, count4)
df <- as.data.frame(t(apply(df, 1, function(x)(2*(x-min(x))/(max(x)-min(x)))- 1)))
df <- cbind(Obs, df)
dff<- df %>%
tidyr::pivot_longer(cols = !Obs, names_to = 'count', values_to = 'Value')
ggplot(dff, aes(x = count, y = Value)) +
geom_jitter(alpha = 0.1, color = "tomato") +
geom_boxplot()
Вывод консоли:
Если вы поворачиваете его дольше, вы можете сгруппировать по своим наблюдениям и масштабу:
df %>%
pivot_longer(cols = !Obs, names_to = 'count', values_to = 'Value') %>% group_by(Obs) %>%
mutate(z=as.numeric(scale(Value))) %>%
ggplot(aes(x=count,y=z))+geom_boxplot()
Или в базе R просто выполните:
boxplot(t(scale(t(df[,-1]))))