Найдите строку со значением, отличным от предыдущей строки в R dplyr

У меня есть фрейм данных, x — номер строки по группе, переменная значения, а изменение отличается от предыдущей строки.

Я хотел бы создать групповую переменную. Если переменная изменения отличается от предыдущей переменной, мы устанавливаем номер строки, но если он одинаковый, мы устанавливаем тот же номер строки из первого значения.

df <- data.frame(x = c(1:11),
           value = c(0, 3, 1, 1, 3, 1, 2, 0, 0, 0, 0),
           change = c(0, -3, 2, 2, -3, 2, -1, 0, 0, 0, 0))

> df
    x value change
1   1     0      0
2   2     3     -3
3   3     1      2
4   4     1      2
5   5     3     -3
6   6     1      2
7   7     2     -1
8   8     0      0
9   9     0      0
10 10     0      0
11 11     0      0

Вот желание df

> df <- data.frame(x = c(1:11),
+            value = c(0, 3, 1, 1, 3, 1, 2, 0, 0, 0, 0),
+            change = c(0, -3, 2, 2, -3, 2, -1, 0, 0, 0, 0),
+            group = c(1, 2, 3, 3, 5, 6, 7, 8, 8, 8, 8))
> df
    x value change group
1   1     0      0     1
2   2     3     -3     2
3   3     1      2     3
4   4     1      2     3
5   5     3     -3     5
6   6     1      2     6
7   7     2     -1     7
8   8     0      0     8
9   9     0      0     8
10 10     0      0     8
11 11     0      0     8

или data.table::rleid(df$change), или consecutive_id = \(x) with(rle(x), rep(seq_along(values), lengths)) или df |> dplyr::mutate(group = dplyr::consecutive_id(change))? Если да, то это дубликат. Пока не нашел. Может быть, кто-то еще.

— 25.08.2024 21:52

Предполагаемый дубликат НЕ отвечает на вопрос. Он отвечает на вопрос о том, как генерировать последовательные идентификаторы, но этот вопрос спрашивает, как маркировать группы по номеру строки первого элемента группы. Желаемый образец вывода, показанный в вопросе, показывает это (идентификаторы НЕ являются последовательными - идентификатор 5 идет после идентификатора 3), как и текст вопроса, в котором говорится: «Если переменная изменения отличается от предыдущей переменной, мы устанавливаем номер строки» . Я снова открыл вопрос.

— 26.08.2024 12:30

r dplyr

25.08.2024 20:52

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

1) Используйте consecutive_id, чтобы присвоить возрастающие значения последовательным группам, и используйте их, чтобы заполнить каждую группу номером строки первого элемента этой группы.

library(dplyr)

make_group <- function (x) {
  g <- consecutive_id(x)
  match(g, g)
}

df %>%
  mutate(group = make_group(change))

предоставление

    x value change group
1   1     0      0     1
2   2     3     -3     2
3   3     1      2     3
4   4     1      2     3
5   5     3     -3     5
6   6     1      2     6
7   7     2     -1     7
8   8     0      0     8
9   9     0      0     8
10 10     0      0     8
11 11     0      0     8

2) В этом подходе мы группируем номер_строки по последовательному_идентификатору и берем первый. Вывод такой же, как (1).

df %>%
  mutate(group = ave(row_number(), consecutive_id(change), FUN = first))

2a) В этом варианте (2) используется match в .by=. Обратите внимание, что mutate — это номер строки в x. Это снова дает тот же ответ:

df %>%
  mutate(consec = consecutive_id(change)) %>%
  mutate(group = first(x), .by = consec) %>%
  select(-consec)

25.08.2024 22:45

В базе R можно адаптировать известный consecutive_id-подход на основе rle() в сочетании с простым ave-вызовом:

consecutive_id = \(x) with(rle(x), rep(seq_along(values), lengths))
df$group = ave(seq(nrow(df)), consecutive_id(df$change), FUN = \(x) x[1L])

предоставление

> df
    x value change group
1   1     0      0     1
2   2     3     -3     2
3   3     1      2     3
4   4     1      2     3
5   5     3     -3     5
6   6     1      2     6
7   7     2     -1     7
8   8     0      0     8
9   9     0      0     8
10 10     0      0     8
11 11     0      0     8

27.08.2024 01:25

Другие вопросы по теме

Создайте новый вычисляемый столбец для фрейма данных с несколькими значениями в строке исходного фрейма данных

Как подсчитать, сколько единиц в каждой строке по заданному количеству столбцов в зависимости от количества отсутствующих/NA, присутствующих в каждой строке в R?

Рассчитайте среднее значение даты и часа из многолетнего кадра данных в r

Подсчитайте количество замен, выполненных str_replace_all в рабочем процессе dplyr

Как преобразовать каждую строку во фрейме данных с помощью произвольной функции?

Разница в выводе между индексированием одинарных и двойных скобок в R case_when()

Есть ли более компактный способ написания цепочек вызовов мутаций по конвейеру?

R: фильтрация dplyr внутри функции с входным значением NULL

Как использовать replace_na() с аргументами функции defuse в R

Проблема с фильтром() при вводе файла .csv в Shiny R

Найдите строку со значением, отличным от предыдущей строки в R dplyr

Ответы 2

Другие вопросы по теме

Похожие вопросы