Что эквивалентно `unstack()` в data.table?

Я хочу преобразовать длинный в широкий формат моих данных, используя data.table. Обычно я использую unstack(), но не знаю, как это сделать в data.table. Ниже приведен пример. В качестве вывода я ожидаю три столбца и три строки.

library(data.table)
set.seed(1)
df <- data.frame(class = factor(rep(c("A", "B", "C"), times = 3)),
                 value = runif (9))
unstack(df, form = value ~ class)
#>           A         B         C
#> 1 0.2655087 0.3721239 0.5728534
#> 2 0.9082078 0.2016819 0.8983897
#> 3 0.9446753 0.6607978 0.6291140

dt <- data.table(df)
dcast(dt, formula = value ~ class, value.var = "value")
#>        value         A         B         C
#> 1: 0.2016819        NA 0.2016819        NA
#> 2: 0.2655087 0.2655087        NA        NA
#> 3: 0.3721239        NA 0.3721239        NA
#> 4: 0.5728534        NA        NA 0.5728534
#> 5: 0.6291140        NA        NA 0.6291140
#> 6: 0.6607978        NA 0.6607978        NA
#> 7: 0.8983897        NA        NA 0.8983897
#> 8: 0.9082078 0.9082078        NA        NA
#> 9: 0.9446753 0.9446753        NA        NA

Кроме того, я не хочу использовать агрегатную функцию, но в data.table на реальных данных я вижу: Aggregate function missing, defaulting to 'length', поэтому в результате меньше строк.

r data.table pivot reshape

23.11.2022 01:44

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Я думаю, это то, что вы хотите:

dcast(dt, rowid(class) ~ class)
#   class         A          B         C
#1:     1 0.2655087 0.3721239 0.5728534
#2:     2 0.9082078 0.2016819 0.8983897
#3:     3 0.9446753 0.6607978 0.6291140

https://stackoverflow.com/a/52501268/10276092

23.11.2022 02:15

Мы можем попробовать split внутри dt, как показано ниже (но эта опция доступна только в том случае, если у нас одинаковое количество значений в классе, поэтому для общих случаев рекомендуется использовать опцию dcast от @M.Viking)

> dt[, split(value, class)]
           A         B         C
1: 0.2655087 0.3721239 0.5728534
2: 0.9082078 0.2016819 0.8983897
3: 0.9446753 0.6607978 0.6291140

Также кажется, что split() в несколько раз быстрее, чем dcast() на большом наборе данных.

— 23.11.2022 12:33

@nukubiho, вероятно, это правда, потому что он на самом деле не поворачивает оригинал dt, а реорганизует данные class

— 23.11.2022 14:00

23.11.2022 10:51