Вычислить среднее значение определенных векторов различных элементов списка() в R и преобразовать в data.frame

У меня есть очень большой list(), который имеет +2000 элементов, где каждый элемент имеет два вектора (x и y) с разными размерами между элементами списка.

Пример:

new_list<-list(data.frame(x = c(1,2,3),
                          y = c(3,4,5)),
               data.frame(x = c(3,2,2,2,3,8),
                          y = c(5,2,3,5,6,7)),
               data.frame(x = c(3,2,2,1,1),
                          y = c(5,2,3,3,2)))

Я хотел бы усреднить только векторы x в этом списке, чтобы получить что-то вроде этого:

df_mean<-data.frame(x=c(2,3.333,1.8))

r list vector mean

06.02.2023 17:51

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

Ответ принят как подходящий

Вы можете рассчитать colMeans для каждого столбца, в котором есть x с sapply, следующим образом:

data.frame(x = sapply(new_list, \(x) colMeans(x[grepl('x', names(x))])))
#>          x
#> 1 2.000000
#> 2 3.333333
#> 3 1.800000

@nicola предложила такой вариант получше (спасибо!):

data.frame(x = sapply(new_list, \(x) mean(x$x)))
#>          x
#> 1 2.000000
#> 2 3.333333
#> 3 1.800000

^{Created on 2023-02-06 with reprex v2.0.2}

Почему бы не просто \(x) mean(x$x)?

— 06.02.2023 17:59

06.02.2023 17:55

Использование map

library(purrr)
library(dplyr)
map_dfr(new_list, ~ .x %>% 
    summarise(x = mean(x)))
         x
1 2.000000
2 3.333333
3 1.800000

один квест: в map_dfr(new_list, ~ .x "x" это функция или переменная x из списка?

— 06.02.2023 18:15

@ wesleysc352 это лямбда-функция, синтаксис function(x) x в tidyverse. ~ относится к function(.x)

— 06.02.2023 18:16

06.02.2023 18:08

Вы также можете enframe список и сделать mean по группам:

library(dplyr) #1.1.0 or higher
library(tibble)
enframe(new_list) %>% 
  unnest(value) %>% 
  summarise(x = mean(x), .by = name)

#   name     x
#1     1  2   
#2     2  3.33
#3     3  1.8

06.02.2023 18:15

Хороший ответ Квинтена. Обычно я предпочитаю следовать принципу KISS. Вот формат, который я считаю синтаксически более простым:

len <- length(new_list)
sapply(1:len, function(z) mean(new_list[[z]][[1]]))
[1] 2.000000 3.333333 1.800000

06.02.2023 18:24

В этом относительно простом случае я бы предпочел более краткое решение, предложенное @quinten. Однако, если вам нужно рассчитать дополнительную статистику по вложенным фреймам данных, вы можете рассмотреть что-то вроде этого:

library(tidyverse)

tibble(data = new_list) |> 
  rowwise() |> 
  summarise(
    x = mean(data$x)
  )
#> # A tibble: 3 × 1
#>       x
#>   <dbl>
#> 1  2   
#> 2  3.33
#> 3  1.8

или альтернативно

tibble(data = new_list) |> 
  rowwise() |> 
  summarise(
    data |> 
      summarise(x = mean(x))
  )
#> # A tibble: 3 × 1
#>       x
#>   <dbl>
#> 1  2   
#> 2  3.33
#> 3  1.8

06.02.2023 19:16

Использование data.table-х rbindlist:

data.table::rbindlist(new_list, idcol = TRUE)[, .(x = mean(x)), .id][, 2]
#>           x
#> 1: 2.000000
#> 2: 3.333333
#> 3: 1.800000

06.02.2023 21:44

Другие вопросы по теме

Как я могу печатать на новых строках?

Динамическая выпадающая кнопка с динамическими значениями из списка в флаттере

Как получить определенные значения из вложенного списка в Python

Поэлементная медиана по спискам фреймов данных в R

Как поместить логическое значение в список и вывести его в Haskell?

R - чтение списка файлов из списка zip архивов без их распаковки

Найдите число в заданном диапазоне так, чтобы общий общий делитель числа с любым элементом заданного списка всегда был равен 1

Печатать статистику из списков в Python — есть ли лучший способ?

Использование операнда «in», чтобы проверить, содержит ли строка ключевое слово с пробелами и без них

Как получить матрицу от пользователя, а затем поместить ее в 2d-список

Вычислить среднее значение определенных векторов различных элементов списка() в R и преобразовать в data.frame

Ответы 6

Другие вопросы по теме

Похожие вопросы