Несколько ящиков бок о бок, а не сверху на одной ящике

Я хотел бы построить несколько коробчатых диаграмм на одной диаграмме и знать, что уже есть похожие темы, но, похоже, ни одна из них не применима к моему случаю.

Описание данных, которые мне нужно визуализировать: у меня есть данные опроса избирателей о том, какие области политики воспринимаются как важные (x), и я хочу сопоставить это данными о том, насколько вероятно, что эти избиратели когда-либо проголосуют за данную партию (y). Это просто, если я хочу сделать это только для одной партии, но идея состоит в том, чтобы построить график для трех партий на одной фигуре (в противном случае у нас было бы слишком много фигур, и их было бы трудно сравнивать друг с другом).

Итак, возьмем эти гипотетические данные (MyData):

Party_A     Party_B     Party_C     Salience
8           2           5           "Environmental policy"
7           0           4           "Environmental policy"
9           3           6           "Environmental policy"
0           9           4           "Tax policy"
1           8           3           "Tax policy"
2           6           3           "Tax policy"
2           3           9           "Immigration policy"
3           5           9           "Immigration policy"
1           6           0           "Immigration policy"

Где "Party_A: C" представляет "Вы когда-нибудь подумали бы о голосовании за ... (шкала от 0 до 10)", а "Важность" просто указывает, какие области политики они назвали важными. (У меня также есть другой набор двоичных переменных, которые идут на 1, если указана область политики, и на 0, если нет, и имена этих переменных являются просто заданной областью политики - на всякий случай, если это необходимо).

Вот что я пробовал:

library(ggplot2)
ggplot(MyData, aes(Salience,Party_A)) + geom_boxplot(fill = "black", alpha=.5) +
geom_boxplot(aes(Salience,Party_B), fill = "blue", alpha=.5) +
geom_boxplot(aes(Salience,Party_C), alpha=.5) +
geom_hline(yintercept=5, color = "darkred", linetype = "dotted") + 
theme(text=element_text(family = "serif"), panel.background=element_blank(),
    axis.text.x=element_text(angle=90,hjust=1,vjust=.3))

Это дает мне следующее: Несколько ящиков бок о бок, а не сверху на одной ящике

Есть две проблемы, которые я не могу решить:

Ящики, очевидно, расположены друг над другом, и даже с альфа = 0,5 они все равно выглядят беспорядочно и не могут ни с чем сравниваться. Таким образом, есть ли способ сгруппировать их как кластер из трех блоков для каждой области политики? Очевидно, было бы неплохо сделать это как здесь, но моя структура данных явно не позволяет реализовать это просто путем включения fill=labels в качестве индикатора группы.
Другой проблемой является NA-bar, от которой я не могу избавиться: я попытался как включить na.omit() в ggplot-code, так и заранее разделить его, сделав следующее: MyData[!is.na(MyData)]. В обоих случаях график исчезнет.

Есть ли решение этого? Благодарен за любой совет!

пожалуйста, добавьте свои исходные данные с помощью dput, сейчас категории NA нет.

— 13.04.2018 13:37

Это будет звучать странно, но в Boxplots нет переменных x (т.е. партии), поэтому вам нужно использовать group.

— 13.04.2018 13:41

Вам нужно изменить форму ваших данных и использовать блочные диаграммы только один раз в вашем коде, например: MyData2 <- tidyr::gather(MyData, Party, value, -Salience); ggplot(MyData2, aes(Salience, value, fill = Party) + geom_boxplot()

— 13.04.2018 13:41

MyData[!is.na(MyData)] Как вы думаете, что это значит? Вам нужно сослаться на конкретный столбец или столбцы там.

— 13.04.2018 13:43

Ссылка, которую вы даете, на самом деле показывает, как изменить форму ваших данных.

— 13.04.2018 13:48

r ggplot2 boxplot

13.04.2018 13:32

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

879

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Один из способов сделать это - работать с вашими данными в длинном формате. Кроме того, это сократит и прояснит вашу команду.

Вы можете использовать функцию melt в пакете reshape2.

library(ggplot2)
library(reshape2)

Это ваш пример данных.

dat <- read.table(text='Party_A     Party_B     Party_C     Salience
8           2           5           "Environmental policy"
7           0           4           "Environmental policy"
9           3           6           "Environmental policy"
0           9           4           "Tax policy"
1           8           3           "Tax policy"
2           6           3           "Tax policy"
2           3           9           "Immigration policy"
3           5           9           "Immigration policy"
1           6           0           "Immigration policy"', 
                  header=TRUE)

Команда для плавления ваших данных.

dat.m <- melt(dat, variable.name = "Party", value.name = "Vote")

И команда для построения ваших данных: ggplot автоматически разместит коробчатые диаграммы там, где они должны быть.

ggplot(data=dat.m, aes(x=Salience, y=Vote, fill=Party)) +
  geom_boxplot(alpha=0.5) + 
  scale_fill_manual(values=c("black", "blue", "white")) +
  geom_hline(yintercept=5, color = "darkred", linetype = "dotted") + 
  theme(text=element_text(family = "serif"), panel.background=element_blank(),
        axis.text.x=element_text(angle=90,hjust=1,vjust=.3))

With melted data