Создать последовательность года-квартала в R

У меня есть набор входных данных, который выглядит следующим образом:

Имя Дата А 2018 кв. 2 А 3 квартал 2019 г. Б 4 квартал 2018 г. Б 4 квартал 2019 г.

И мой желаемый результат выглядит так:

Имя Дата А 2 квартал 2018 г. А 3 квартал 2018 г. А 4 квартал 2018 г. А 1 квартал 2019 г. А 2 квартал 2019 г. А 3 квартал 2019 г. Б 4 квартал 2018 г. Б 1 квартал 2019 г. Б 2 квартал 2019 г. Б 3 квартал 2019 г. Б 4 квартал 2019 г.

В настоящее время у меня есть цикл for (анализируем год и квартал и продолжаем добавлять 1 к началу квартала, пока не достигнем конечной даты) Однако выполнение цикла занимает много времени. Мне интересно, есть ли более быстрые способы сделать это?

Спасибо!

r date as.yearqtr

17.06.2024 18:10

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

library(tidyr)
library(purrr)

# Sample data
data <- data.frame(
  Name = c('A', 'A', 'B', 'B'),
  Date = c('2018 Q2', '2019 Q3', '2018 Q4', '2019 Q4'),
  stringsAsFactors = FALSE
)

# Function to create a sequence of quarters
create_quarter_sequence <- function(start, end) {
  start_year <- as.numeric(substr(start, 1, 4))
  start_quarter <- as.numeric(substr(start, 7, 7))
  end_year <- as.numeric(substr(end, 1, 4))
  end_quarter <- as.numeric(substr(end, 7, 7))
  
  # Create sequence of quarters
  quarters <- c()
  current_year <- start_year
  current_quarter <- start_quarter
  
  while (current_year < end_year || (current_year == end_year && current_quarter <= end_quarter)) {
    quarters <- c(quarters, paste(current_year, paste0("Q", current_quarter), sep = " "))
    current_quarter <- current_quarter + 1
    if (current_quarter > 4) {
      current_quarter <- 1
      current_year <- current_year + 1
    }
  }
  
  return(quarters)
}

# Process the data
result <- data %>%
  group_by(Name) %>%
  summarise(
    start_date = min(Date),
    end_date = max(Date)
  ) %>%
  rowwise() %>%
  mutate(
    Date = list(create_quarter_sequence(start_date, end_date))
  ) %>%
  unnest(cols = c(Date)) %>%
  select(Name, Date)

print(result)

17.06.2024 18:20

С помощью dplyr и tidyr и немного математики вы можете сделать следующее

library(tidyr)
library(dplyr)
dd %>% 
  separate_wider_delim(Date, " Q", names = c("year", "q")) %>% 
  mutate(across(c(year, q), as.numeric)) %>% 
  mutate(index=year * 4 + q-1) %>% 
  group_by(Name) %>% 
  reframe(index = full_seq(index, period=1), 
          year = index %/% 4, 
          q = index %% 4+1, 
          Date = paste0(year, " Q", q)) %>% 
  select(Name, Date)

который возвращает

   Name  Date   
   <chr> <chr>  
 1 A     2018 Q2
 2 A     2018 Q3
 3 A     2018 Q4
 4 A     2019 Q1
 5 A     2019 Q2
 6 A     2019 Q3
 7 B     2018 Q4
 8 B     2019 Q1
 9 B     2019 Q2
10 B     2019 Q3
11 B     2019 Q4

Мы создаем специальный индекс, чтобы нам было легче заполнить последовательность год + квартал для каждой группы.

17.06.2024 18:25

Ответ принят как подходящий

Преобразуйте вyearqtr и затем используйте seq. Обратите внимание, чтоyearqtr представляет год и кварталы как год плюс 0, 1/4, 2/4 и 3/4 для 4 кварталов, поэтому использование seq с by=1/4 будет работать.

library(dplyr)
library(zoo)

DF %>%
  mutate(Date = as.yearqtr(Date)) %>%
  reframe(Date = seq(Date[1], Date[2], 1/4), .by = Name)

предоставление

   Name    Date
1     A 2018 Q2
2     A 2018 Q3
3     A 2018 Q4
4     A 2019 Q1
5     A 2019 Q2
6     A 2019 Q3
7     B 2018 Q4
8     B 2019 Q1
9     B 2019 Q2
10    B 2019 Q3
11    B 2019 Q4

Примечание

DF <- data.frame(
  Name = rep(c("A", "B"), each = 2L),
  Date = c("2018 Q2", "2019 Q3", "2018 Q4", "2019 Q4")
)

17.06.2024 18:53

На самом деле это похоже на expand.grid(LETTERS[1:2], 2018:2019, paste0('Q', 1:4)). Чтобы получить коэффициенты, мы можем использовать unique и substr. Я думаю, мы можем жестко запрограммировать кварталы.

> by(df, ~Name, \(x) {
+   with(x, 
+        list(unique(Name),
+             unique(substr(Date, 1, 4)), 
+             paste0('Q', 1:4))
+   ) |> do.call(what='expand.grid') |> 
+     {\(.) transform(., Date=Reduce(paste, .[2:3]),
+                     Var2=NULL, Var3=NULL)}()  |> 
+     setNames(names(x)) |> 
+     sort_by(~list(Name, Date)) |> 
+     subset(Date >= min(x$Date) & Date <= max(x$Date))
+ }) |> c(make.row.names=FALSE) |> do.call(what='rbind')
   Name    Date
1     A 2018 Q2
2     A 2018 Q3
3     A 2018 Q4
4     A 2019 Q1
5     A 2019 Q2
6     A 2019 Q3
7     B 2018 Q4
8     B 2019 Q1
9     B 2019 Q2
10    B 2019 Q3
11    B 2019 Q4

Данные:

> dput(df)
structure(list(Name = c("A", "A", "B", "B"), Date = c("2018 Q2", 
"2019 Q3", "2018 Q4", "2019 Q4")), class = "data.frame", row.names = c(NA, 
-4L))

18.06.2024 06:28

Другие вопросы по теме

Вернуть имя столбца, соответствующее значению даты

Найдите первый рабочий день и последний рабочий день предыдущего месяца по дате

Рассчитать дни каждого месяца в диапазоне дат в формуле Excel

Дата GNU — анализ часового пояса в формате +ЧЧ:ММ

Google таблицы – расчет часов смены

Столбец с числовой датой и отформатированными датами (03.10.2020)

Bash Date только возвращается в полночь

Как активировать ячейку в столбце с текущей датой в скрипте Google Sheets?

Фильтрация моего фрейма данных стирает мой фрейм данных, несмотря на правильное количество строк

Дата Power BI и если

Создать последовательность года-квартала в R

Ответы 4

Примечание

Другие вопросы по теме

Похожие вопросы