Заполните внутренние NA нулями

В моем кадре данных есть столбец даты и два столбца с числовыми значениями, включая некоторые NAs, что-то вроде этого:

df
#          Date  a  b
# 1  1990-02-01 NA NA
# 2  1990-03-01 NA NA
# 3  1990-04-01 NA  3
# 4  1990-05-01  1  4
# 5  1990-06-01  2  5
# 6  1990-07-01  3 NA
# 7  1990-08-01  4  7
# 8  1990-09-01  5 NA
# 9  1990-10-01  6  9
# 10 1990-11-01  7 NA
# 11 1990-12-01  8 NA
# 12 1991-01-01  9 NA
# 13 1991-02-01 10 13
# 14 1991-03-01 11 14
# 15 1991-04-01 12 15
# 16 1991-05-01 13 NA

Я хочу сохранить NA, которые приходят до начала временного ряда, и впоследствии заменить их нулями. Конечный результат должен выглядеть так:

finaldf
#          Date  a  b
# 1  1990-02-01 NA NA
# 2  1990-03-01 NA NA
# 3  1990-04-01 NA  3
# 4  1990-05-01  1  4
# 5  1990-06-01  2  5
# 6  1990-07-01  3  0
# 7  1990-08-01  4  7
# 8  1990-09-01  5  0
# 9  1990-10-01  6  9
# 10 1990-11-01  7  0
# 11 1990-12-01  8  0
# 12 1991-01-01  9  0
# 13 1991-02-01 10 13
# 14 1991-03-01 11 14
# 15 1991-04-01 12 15
# 16 1991-05-01 13  0

Есть ли какая-то функция замены/заполнения из какого-нибудь классного пакета, которая делает это? Или как бы вы справились с этим сами?

Данные

df <- data.frame(Date=seq(lubridate::ymd('1990-02-01'), lubridate::ymd('1991-05-01'), by='1 month'), 
                 a=c(rep(NA, 3), 1:13), 
                 b=c(NA, NA, 3, 4, 5, NA, 7, NA, 9, NA, NA, NA, 13, 14, 15, NA))

finaldf <- data.frame(Date=seq(lubridate::ymd('1990-02-01'), lubridate::ymd('1991-05-01'), by='1 month'), 
                      a=c(rep(NA, 3), 1:13), 
                      b=c(NA, NA, 3, 4, 5, 0, 7, 0, 9, 0, 0, 0, 13, 14, 15, 0))

r replace na fill

09.04.2023 22:49

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 5

Вы можете рассмотреть что-то вроде этого:

df <- data.frame(Date = seq(ymd('1990-02-01'),ymd('1991-05-01'), by = '1 month'), 
                 a = c(rep(NA,3),1:13), 
                 b = c(NA,NA,3,4,5,NA,7,NA,9,NA,NA,NA,13,14,15,NA) )

df$b <- ifelse(is.na(df$b) & (df$Date > "1990-04-01"), 0, df$b)

df
         Date  a  b
1  1990-02-01 NA NA
2  1990-03-01 NA NA
3  1990-04-01 NA  3
4  1990-05-01  1  4
5  1990-06-01  2  5
6  1990-07-01  3  0
7  1990-08-01  4  7
8  1990-09-01  5  0
9  1990-10-01  6  9
10 1990-11-01  7  0
11 1990-12-01  8  0
12 1991-01-01  9  0
13 1991-02-01 10 13
14 1991-03-01 11 14
15 1991-04-01 12 15
16 1991-05-01 13  0

09.04.2023 23:04

Мы могли бы сделать это с помощью across проверки столбца a и b в сочетании с оператором ifelse:

library(dplyr)

df %>% 
  mutate(across(c(a, b), ~ifelse(Date > Date[4] & is.na(.), 0, .)))
 #mutate(across(c(a, b), ~ifelse(Date > Date[a==1] & is.na(.), 0, .))) # more general

 Date           a     b
   <date>     <int> <dbl>
 1 1990-02-01    NA    NA
 2 1990-03-01    NA    NA
 3 1990-04-01    NA     3
 4 1990-05-01     1     4
 5 1990-06-01     2     5
 6 1990-07-01     3     0
 7 1990-08-01     4     7
 8 1990-09-01     5     0
 9 1990-10-01     6     9
10 1990-11-01     7     0
11 1990-12-01     8     0
12 1991-01-01     9     0
13 1991-02-01    10    13
14 1991-03-01    11    14
15 1991-04-01    12    15
16 1991-05-01    13     0

09.04.2023 23:11

Ответ принят как подходящий

Это в основном похоже на ответ TarJae, но немного более динамично:

library(dplyr)

df %>% 
  mutate(across(c(a, b), ~ifelse(cumsum(!is.na(.)) > 0 & is.na(.), 0, .)))

Это возвращает

         Date  a  b
1  1990-02-01 NA NA
2  1990-03-01 NA NA
3  1990-04-01 NA  3
4  1990-05-01  1  4
5  1990-06-01  2  5
6  1990-07-01  3  0
7  1990-08-01  4  7
8  1990-09-01  5  0
9  1990-10-01  6  9
10 1990-11-01  7  0
11 1990-12-01  8  0
12 1991-01-01  9  0
13 1991-02-01 10 13
14 1991-03-01 11 14
15 1991-04-01 12 15
16 1991-05-01 13  0

10.04.2023 00:03

Мы можем replace между which.min и which.max, пакет не требуется.

u <- which.min(df$b):which.max(df$b)
df$b[u] <- replace(df$b[u], is.na(df$b[u]), 0)
df
#          Date  a  b
# 1  1990-02-01 NA NA
# 2  1990-03-01 NA NA
# 3  1990-04-01 NA  3
# 4  1990-05-01  1  4
# 5  1990-06-01  2  5
# 6  1990-07-01  3  0
# 7  1990-08-01  4  7
# 8  1990-09-01  5  0
# 9  1990-10-01  6  9
# 10 1990-11-01  7  0
# 11 1990-12-01  8  0
# 12 1991-01-01  9  0
# 13 1991-02-01 10 13
# 14 1991-03-01 11 14
# 15 1991-04-01 12 15
# 16 1991-05-01 13 NA

Данные:

df <- structure(list(Date = structure(c(7336, 7364, 7395, 7425, 7456, 
7486, 7517, 7548, 7578, 7609, 7639, 7670, 7701, 7729, 7760, 7790
), class = "Date"), a = c(NA, NA, NA, 1L, 2L, 3L, 4L, 5L, 6L, 
7L, 8L, 9L, 10L, 11L, 12L, 13L), b = c(NA, NA, 3, 4, 5, NA, 7, 
NA, 9, NA, NA, NA, 13, 14, 15, NA)), class = "data.frame", row.names = c(NA, 
-16L))

10.04.2023 09:54

zoo::na.fill принимает второй аргумент с 3 элементами, которые используются для заполнения начального, внутреннего и конечного NA, поэтому:

library(zoo)

replace(df, -1, na.fill(df[-1], c(NA, 0, 0)))

или

df[-1] <- na.fill(df[-1], c(NA, 0, 0))

10.04.2023 20:36

Другие вопросы по теме

Использование замены или замены для замены указанных символов на символы в другой ячейке в определенном порядке Excel

Привет, как получить строку между запятыми

Обнаружение определенной строки символов

Регулярное выражение Python для удаления строки, которая может содержать дополнительный символ

Изменить HTML-ответ quill-mention на краткий формат @data-ids

Замените первые два символа каждой строки для каждого столбца во фрейме данных

Почему эти replace(), re.sub() или strip() не работают с этой строкой?

VBA для замены текста ячейки, который начинается с ### на = в 3 разных столбцах, не затрагивая строки с 1 по 15

Как заменить числа в строке, если они больше переменной?

Как заменить все элементы в списке одной переменной

Заполните внутренние NA нулями

Данные

Ответы 5

Другие вопросы по теме

Похожие вопросы