Я хотел бы построить несколько коробчатых диаграмм на одной диаграмме и знать, что уже есть похожие темы, но, похоже, ни одна из них не применима к моему случаю.
Описание данных, которые мне нужно визуализировать: у меня есть данные опроса избирателей о том, какие области политики воспринимаются как важные (x), и я хочу сопоставить это данными о том, насколько вероятно, что эти избиратели когда-либо проголосуют за данную партию (y). Это просто, если я хочу сделать это только для одной партии, но идея состоит в том, чтобы построить график для трех партий на одной фигуре (в противном случае у нас было бы слишком много фигур, и их было бы трудно сравнивать друг с другом).
Итак, возьмем эти гипотетические данные (MyData):
Party_A Party_B Party_C Salience
8 2 5 "Environmental policy"
7 0 4 "Environmental policy"
9 3 6 "Environmental policy"
0 9 4 "Tax policy"
1 8 3 "Tax policy"
2 6 3 "Tax policy"
2 3 9 "Immigration policy"
3 5 9 "Immigration policy"
1 6 0 "Immigration policy"
Где "Party_A: C" представляет "Вы когда-нибудь подумали бы о голосовании за ... (шкала от 0 до 10)", а "Важность" просто указывает, какие области политики они назвали важными. (У меня также есть другой набор двоичных переменных, которые идут на 1, если указана область политики, и на 0, если нет, и имена этих переменных являются просто заданной областью политики - на всякий случай, если это необходимо).
Вот что я пробовал:
library(ggplot2)
ggplot(MyData, aes(Salience,Party_A)) + geom_boxplot(fill = "black", alpha=.5) +
geom_boxplot(aes(Salience,Party_B), fill = "blue", alpha=.5) +
geom_boxplot(aes(Salience,Party_C), alpha=.5) +
geom_hline(yintercept=5, color = "darkred", linetype = "dotted") +
theme(text=element_text(family = "serif"), panel.background=element_blank(),
axis.text.x=element_text(angle=90,hjust=1,vjust=.3))
Есть две проблемы, которые я не могу решить:
fill=labels в качестве индикатора группы.na.omit() в ggplot-code, так и заранее разделить его, сделав следующее: MyData[!is.na(MyData)]. В обоих случаях график исчезнет.Есть ли решение этого? Благодарен за любой совет!
Это будет звучать странно, но в Boxplots нет переменных x (т.е. партии), поэтому вам нужно использовать group.
Вам нужно изменить форму ваших данных и использовать блочные диаграммы только один раз в вашем коде, например: MyData2 <- tidyr::gather(MyData, Party, value, -Salience); ggplot(MyData2, aes(Salience, value, fill = Party) + geom_boxplot()
MyData[!is.na(MyData)] Как вы думаете, что это значит? Вам нужно сослаться на конкретный столбец или столбцы там.
Ссылка, которую вы даете, на самом деле показывает, как изменить форму ваших данных.





Один из способов сделать это - работать с вашими данными в длинном формате. Кроме того, это сократит и прояснит вашу команду.
Вы можете использовать функцию melt в пакете reshape2.
library(ggplot2)
library(reshape2)
Это ваш пример данных.
dat <- read.table(text='Party_A Party_B Party_C Salience
8 2 5 "Environmental policy"
7 0 4 "Environmental policy"
9 3 6 "Environmental policy"
0 9 4 "Tax policy"
1 8 3 "Tax policy"
2 6 3 "Tax policy"
2 3 9 "Immigration policy"
3 5 9 "Immigration policy"
1 6 0 "Immigration policy"',
header=TRUE)
Команда для плавления ваших данных.
dat.m <- melt(dat, variable.name = "Party", value.name = "Vote")
И команда для построения ваших данных: ggplot автоматически разместит коробчатые диаграммы там, где они должны быть.
ggplot(data=dat.m, aes(x=Salience, y=Vote, fill=Party)) +
geom_boxplot(alpha=0.5) +
scale_fill_manual(values=c("black", "blue", "white")) +
geom_hline(yintercept=5, color = "darkred", linetype = "dotted") +
theme(text=element_text(family = "serif"), panel.background=element_blank(),
axis.text.x=element_text(angle=90,hjust=1,vjust=.3))
пожалуйста, добавьте свои исходные данные с помощью
dput, сейчас категорииNAнет.