График изменения температуры во времени (дата)

Я пытаюсь построить график температуры с течением времени (в виде даты), однако я не уверен, как это сделать.

Смотрите здесь мою исходную таблицу в Excel:

Или как код R:

dput(Average_temperature_period)
structure(list(Sample = c("ZS_IG_1", "AK_SN_1", "JP_IG_2", "AW_IG_1", 
"SBB_SN_1", "AW_IG_2", "JvH_IG_3", "JvH_IG_2", "SBB_SN_4", "SBB_SN_3", 
"SBB_SN_2", "EF_SN_1", "JP_IG_2", "JvH_IG_3", "EF_SN_1", "JvH_IG_2", 
"AK_SN_1", "ZS_IG_1", "AW_IG_1", "SBB_SN_1", "AW_IG_2", "SBB_SN_4", 
"SBB_SN_3", "SBB_SN_2"), Sampling_date = c("23/03/2022", "24/03/2022", 
"25/03/2022", "25/03/2022", "25/03/2022", "25/03/2022", "29/03/2022", 
"29/03/2022", "01/04/2022", "01/04/2022", "01/04/2022", "12/04/2022", 
"25/04/2022", "26/04/2022", "28/04/2022", "29/04/2022", "03/05/2022", 
"04/05/2022", "10/05/2022", "10/05/2022", "11/05/2022", "11/05/2022", 
"12/05/2022", "12/05/2022"), Period = c("March", "March", "March", 
"March", "March", "March", "March", "March", "March", "March", 
"March", "March", "AprilMay", "AprilMay", "AprilMay", "AprilMay", 
"AprilMay", "AprilMay", "AprilMay", "AprilMay", "AprilMay", "AprilMay", 
"AprilMay", "AprilMay"), Average_temperature_field = c(7.137037037, 
6.966666667, 10.55555556, 7.281481481, 6.874074074, 9.211111111, 
9.662962963, 8.12962963, 6.707407407, 6.774074074, 7.162962963, 
8.114814815, NA, 11.74814815, 13.51111111, 11.29259259, 15.4962963, 
NA, 15.45925926, 17.14814815, 17.72592593, 15.84074074, 16.85555556, 
19.78148148), Average_moisture_field = c(33.48518519, 47.35555556, 
32.54814815, 34.01851852, 38.66666667, 31.71851852, 23.54814815, 
26.83333333, 42.47777778, 29.45555556, 44.50740741, 40.27407407, 
25.77407407, 18.91481481, 26.67777778, 16.27407407, 25.38518519, 
19.9962963, 18.27777778, 16.14074074, 22.86666667, 23.48518519, 
13.93703704, 20.92222222)), row.names = c(NA, 24L), class = "data.frame")

Смотрите здесь мой код в R до сих пор:

##### Soil temperature graph
Average_temperature_period <- read.csv("~/Desktop/First Internship/MicroResp/R/R script/Average_temperature_period.csv")

Average_temperature_period$Sampling_date <- as.character(Average_temperature_period$Sampling_date)

Average_temperature_period <- Average_temperature_period[c(1:24),c(1:5)]


# Change order x axis (past to present)
Average_temperature_period$Sampling_date <- factor(Average_temperature_period$Sampling_date, levels = c("23/03/22","24/03/22","25/03/22","29/03/22","01/04/22","12/04/22","25/04/22","26/04/22","28/04/22","29/04/22","03/05/22","04/05/22","10/05/22","11/05/22","12/05/22"))

# Plot average temperature against the date
ggplot(data=Average_temperature_period, aes(x=Sampling_date, y=Average_temperature_field)) +
  geom_smooth(method = "lm", se=FALSE, color = "black", aes(group=1)) + 
  theme_classic() +
  ylab("Average soil temperature (°C)") + 
  xlab("Sampling date")

По оси x продолжает отображаться «NA» для даты выборки. Кто-нибудь знает, почему и как это исправить? Я хотел бы иметь ось x в порядке даты (от прошлого к настоящему).

Почему бы не изменить столбец даты на формат даты?

— 25.11.2022 19:07

Привет, Стефани, добро пожаловать в Stack Overflow. Не могли бы вы предоставить свои данные в виде текста, не изображения ? Запустите dput(Average_temperature_period) в R и скопируйте/вставьте в свой пост. См. здесь, чтобы узнать больше о том, как задавать эффективные вопросы R на SO.

— 25.11.2022 19:10

Что ты конкретно имеешь ввиду? Разве столбец даты уже не в формате даты?

— 25.11.2022 19:10

@zephryl, спасибо за предложение. Я прикрепил код R через dput в этом посте.

— 25.11.2022 19:15

Возможно, сохраните состояние data.frame сразу после read.csv() , в вашем текущем dput() все даты просто NAs.

— 25.11.2022 19:22

В R «23.03.2022» — это просто текстовые («символьные») данные. В R есть тип данных Date, который вы хотите использовать для вычислений и построения графиков. в базе R вы бы использовали as.Date(YOUR_DATES, format = "%d/%m/%Y") или, возможно, более удобно использовать lubridate::dmy(YOUR_DATES), где dmy — это функция для синтаксического анализа дат в порядке день-месяц-год.

— 25.11.2022 19:35

r ggplot2

25.11.2022 18:51

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Обновление с новыми данными и запросом OP: добавление этой строки drop_na(Average_temperature_field) %>%

library(tidyverse)
library(lubridate)
df %>% 
  drop_na(Average_temperature_field) %>% 
  mutate(Sampling_date = dmy(Sampling_date)) %>% 
  group_by(Sampling_date) %>% 
  summarise(avg_temp_day = mean(Average_temperature_field,na.rm = TRUE)) %>% 
  ggplot(aes(x = Sampling_date, y=avg_temp_day))+
  geom_point()+
  geom_line()+
  scale_x_date(date_labels = "%d %b",date_breaks   = "1 day")+
  theme_bw()+
  theme(axis.text.x = element_text(angle = 45, vjust = 0.5, hjust=1))

Первый ответ: Вот один из способов сделать это. У вас иногда две температуры в день, поэтому я использовал среднее значение для этого дня:

library(tidyverse)
library(lubridate)
df %>% 
  mutate(Sampling_date = dmy(Sampling_date)) %>% 
  group_by(Sampling_date) %>% 
 summarise(avg_temp_day = mean(Average_temperature_field,na.rm = TRUE)) %>% 
  ggplot(aes(x = Sampling_date, y=avg_temp_day))+
  geom_point()+
  geom_line()+
  scale_x_date(date_labels = "%d %b",date_breaks   = "2 day")+
  theme_bw()+
  theme(axis.text.x = element_text(angle = 45, vjust = 0.5, hjust=1))

данные:

df <- structure(list(Sample = c("ZS_IG_1", "AK_SN_1", "JP_IG_2", "AW_IG_1", 
"SBB_SN_1", "AW_IG_2", "JvH_IG_3", "JvH_IG_2", "SBB_SN_4", "SBB_SN_3", 
"SBB_SN_2", "EF_SN_1", "JP_IG_2", "JvH_IG_3", "EF_SN_1", "JvH_IG_2", 
"AK_SN_1", "ZS_IG_1", "AW_IG_1", "SBB_SN_1", "AW_IG_2", "SBB_SN_4", 
"SBB_SN_3", "SBB_SN_2"), Sampling_date = c("23/03/2022", "24/03/2022", 
"25/03/2022", "25/03/2022", "25/03/2022", "25/03/2022", "29/03/2022", 
"29/03/2022", "01/04/2022", "01/04/2022", "01/04/2022", "12/04/2022", 
"25/04/2022", "26/04/2022", "28/04/2022", "29/04/2022", "03/05/2022", 
"04/05/2022", "10/05/2022", "10/05/2022", "11/05/2022", "11/05/2022", 
"12/05/2022", "12/05/2022"), Period = c("March", "March", "March", 
"March", "March", "March", "March", "March", "March", "March", 
"March", "March", "AprilMay", "AprilMay", "AprilMay", "AprilMay", 
"AprilMay", "AprilMay", "AprilMay", "AprilMay", "AprilMay", "AprilMay", 
"AprilMay", "AprilMay"), Average_temperature_field = c(33.48518519, 
47.35555556, 32.54814815, 34.01851852, 38.66666667, 31.71851852, 
23.54814815, 26.83333333, 42.47777778, 29.45555556, 44.50740741, 
40.27407407, 25.77407407, 11.74814815, 13.51111111, 11.29259259, 
15.4962963, 19.9962963, 15.45925926, 17.14814815, 17.72592593, 
15.84074074, 16.85555556, 19.78148148), Average_moisture_field = c(7.137037037, 
6.966666667, 10.55555556, 7.281481481, 6.874074074, 9.211111111, 
9.662962963, 8.12962963, 6.707407407, 6.774074074, 7.162962963, 
8.114814815, NA, 18.91481481, 26.67777778, 16.27407407, 25.38518519, 
NA, 18.27777778, 16.14074074, 22.86666667, 23.48518519, 13.93703704, 
20.92222222)), class = "data.frame", row.names = c(NA, -24L))

Большое спасибо за быстрый и полезный ответ. Это именно то, что я хотел.

— 25.11.2022 19:30

Мне просто интересно еще одно: я случайно прикрепил сюда неправильные данные о температуре/влажности. Правильный формат теперь прикреплен к исходному сообщению. Однако, когда я использую ваш код, я получаю «пробелы» на графике. Не могли бы вы помочь мне с этой проблемой?

— 25.11.2022 19:36

Я проверил это. с вашими новыми данными пробелы верны. Указав, что у вас нет данных по этим дням! Так что мы не можем сейчас сказать, как будет развиваться кривая, потому что у нас нет данных. Так что это нормально иметь прерванную линию! Если вы не хотите прерывать строку, добавьте эту строку: drop_na(Average_temperature_field) %>% как вторую строку после df %>%. Но будьте уверены, что вы хотите это сделать!

— 25.11.2022 19:45

Отлично, это сработало отлично. Спасибо за помощь и хорошего дня!

— 25.11.2022 19:50

25.11.2022 19:26