Как убрать хвост с NA в r?

У меня есть вектор:

a <- c(NA,1:5,NA,NA,1:3, rep(NA,round(runif (1,0,100))))

Мне нужно удалить завершающие NAs. Желаемый результат:

c(NA, 1:5, NA, NA, 1:3)

Связано: Удалить начальный и конечный NA

Henrik 02.02.2021 01:00
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
3
1
404
6
Перейти к ответу Данный вопрос помечен как решенный

Ответы 6

Один вариант будет

a[rev(cumprod(rev(is.na(a)))) == 0]
# [1] NA  1  2  3  4  5 NA NA  1  2  3

Вот шаги:

(a <- c(NA, 1:5, NA, NA, 1:3, NA, NA))
# [1] NA  1  2  3  4  5 NA NA  1  2  3 NA NA
is.na(a)
# [1]  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE  TRUE  TRUE
rev(is.na(a))
# [1]  TRUE  TRUE FALSE FALSE FALSE  TRUE  TRUE FALSE FALSE FALSE FALSE FALSE  TRUE
cumprod(rev(is.na(a)))
# [1] 1 1 0 0 0 0 0 0 0 0 0 0 0
rev(cumprod(rev(is.na(a))))
# [1] 0 0 0 0 0 0 0 0 0 0 0 1 1

Я думаю, что это работает:

rm_NA_tail <- function(a) {
  if (is.na(a[length(a)])) {
    return(a[is.na(match(data.table::rleid(a), max(data.table::rleid(a))))])
  } else {
    return(a)
  }
}
Ответ принят как подходящий

Ты можешь сделать

a[1:max(which(!is.na(a)))]
# [1] NA  1  2  3  4  5 NA NA  1  2  3

Мы подмножаем вектор от позиции 1 до последнего значения, отличного от NA.

Это не работает в (вероятно, очень маловероятном) случае, когда a содержит только NA.

Julius Vainora 10.04.2019 22:14

Вы можете найти максимальную позицию, которая не является NA, и соответственно подмножить

> a[1:max(which(!is.na(a)))]
 [1] NA  1  2  3  4  5 NA NA  1  2  3

Также возможность:

a[cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)]

 [1] NA  1  2  3  4  5 NA NA  1  2  3

В отдельных шагах:

is.na(a)

 [1]  TRUE FALSE FALSE FALSE FALSE

cumsum(!is.na(a))

 [1] 0 1 2 3 4

cumsum(!is.na(a)) != max(cumsum(!is.na(a)))

 [1]  TRUE  TRUE  TRUE  TRUE  TRUE

cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)

 [1]  TRUE  TRUE  TRUE  TRUE  TRUE

Ради интереса небольшой бенчмаркинг:

library(microbenchmark)

a <- rep(a, 1e5)

 microbenchmark(
 markus = a[1:max(which(!is.na(a)))],
 Julius_Vainora = a[rev(cumprod(rev(is.na(a)))) == 0],
 Kim = rm_NA_tail(a),
 tmfmnk = a[cumsum(!is.na(a)) != max(cumsum(!is.na(a))) * is.na(a)],
 nsinghs = a[1:(length(a) - rle(is.na(rev(a)))$lengths[1])],
 times = 5
)

Unit: milliseconds
           expr      min       lq     mean   median       uq       max neval cld
         markus 150.7346 153.0674 156.4194 153.3031 159.4718  165.5201     5 a  
 Julius_Vainora 393.8520 418.8186 616.3269 703.4022 749.6600  815.9018     5  bc
            Kim 370.7680 382.1826 536.0828 632.0031 642.1882  653.2720     5  bc
         tmfmnk 390.2626 415.2378 466.4245 415.8310 423.3828  687.4082     5  b 
        nsinghs 537.0404 781.1403 798.6929 793.1027 842.6777 1039.5033     5   c

Это можно сделать с помощью rle()

a[1:(length(a) - rle(is.na(rev(a)))$lengths[1])]
#  [1] NA  1  2  3  4  5 NA NA  1  2  3

rle(is.na(rev(a)))$lengths[1] получает количество конечных NA в векторе, затем вычитает его из общего вектора length, чтобы получить индекс, до которого вы хотите сохранить вектор.

Другие вопросы по теме