От широкого до длинного с сохранением группы

Как бы мне преобразовать следующий data.frame из широкого в длинный, а также создать групповой столбец?

Пример данных:

dat <- data.frame(ID=paste0("id",1:10),readout1_g1=rnorm(10),readout1_g2=rnorm(10),readout1_g3=rnorm(10),readout2_g1=rnorm(10),readout2_g2=rnorm(10),readout2_g3=rnorm(10))

У меня есть следующие интересующие меня группы, которые являются частью имен столбцов

groups <- c("g1","g2","g3","g1","g2","g3")

dat
     ID readout1_g1 readout1_g2 readout1_g3 readout2_g1 readout2_g2 readout2_g3
1   id1   0.2732715  -0.6328317  -1.3024276   1.7248944  -0.3343275  1.36908631
2   id2   2.0209029  -0.8575063   0.6022883  -0.9226497   1.4893213 -0.98697968
3   id3   1.6034079   0.8023266   1.0845380   1.2936800  -0.7395568 -0.29720316
4   id4  -1.5122641  -2.5982733   0.4245139  -1.2592326   1.5311672  0.38242248
5   id5   0.8096931  -0.6260401   0.7163551   0.2675392   0.8919616  0.01563483
6   id6  -0.8557278   0.1875746   1.3020202   0.4973898   2.7477934  0.38654868
7   id7   0.1556841  -1.1668916   0.6434463  -0.2245761  -0.6832238 -2.50482389
8   id8   0.7511197   0.4819956   0.2385116  -1.0582192   0.1067799  2.15636372
9   id9  -0.4613545  -1.2080645   1.3165922  -2.1785463  -1.2692302 -0.44555107
10 id10   0.3601222  -0.2414607  -1.5775119   2.0834873  -0.4656254  1.58457613

Я хотел бы получить следующий длинный формат:

ID readout1 readout2 group
id1 value value g1
id2 value value g1
...
id10 value value g3

Я пытался использовать pivot_longer в его самой простой форме, но строки не были правильно упорядочены по группам в тех строках, где g1 вместо readout1 и g2 вместо readout2, например.

Вы правы, гугл меня к этому не привел к сожалению.

— 18.05.2022 00:37

18.05.2022 00:17

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать pivot_longer для извлечения группы, а затем pivot_wider для восстановления столбцов readout:

library(dplyr)
library(tidyr)

dat %>% 
  pivot_longer(-ID, names_pattern = "(.*)_(.*)", names_to = c("name", "grp")) %>% 
  pivot_wider()

Это возвращает

# A tibble: 30 x 4
   ID    grp   readout1 readout2
   <chr> <chr>    <dbl>    <dbl>
 1 id1   g1      0.732    0.499 
 2 id1   g2     -0.301   -0.0941
 3 id1   g3      0.198    1.62  
 4 id2   g1      0.653    0.732 
 5 id2   g2     -0.325    1.49  
 6 id2   g3     -0.0475  -1.73  
 7 id3   g1     -1.59     1.25  
 8 id3   g2     -1.59     0.688 
 9 id3   g3     -0.738    0.341 
10 id4   g1      1.12     1.11  
# ... with 20 more rows

18.05.2022 00:33

Другие вопросы по теме

Извлечение значений из матрицы на основе матрицы индексов строк и матрицы индексов столбцов

Однострочный для объединения двух фреймов данных с отличительным столбцом?

Подсчет событий по группам в день, включая 0 в R

Как я могу преобразовать этот файл ABES ASCII/.dat в рабочий файл CSV в R?

Как выполнять операции только с определенными ячейками фрейма данных в R dplyr

Использование условия, связанного с частью слова в r

Изменить пределы x с процентной шкалой в гистограмме ggplot

Попытка group_by, а затем суммирование максимального и минимального значений - приводит к ошибке для однозначного формата

Как выбрать одну строку из нескольких с одинаковым значением в столбце в зависимости от наибольшего значения другого столбца?

Добавление даты и времени к длительности событий

От широкого до длинного с сохранением группы

Ответы 1

Другие вопросы по теме

Похожие вопросы