Я пытаюсь определить, сколько дней в каждом из моих столбцов записывались значения. Все они начинают/останавливают запись в разное время, и важно, чтобы вычисленное общее количество дней не включало время, когда в столбце есть NA. Вот пример моего фрейма данных
df = structure(list(Date_Time_GMT_3 = structure(c(1594233000, 1594533900, 1597235700,
1595234800, 1594336600, 1595237500),
class = c("POSIXct", "POSIXt"), tzone = "EST"),
`20874285_33MR` = c(14.996, 15.091, 15.187, 15.282, 15.378, 15.378),
`20874290_103MR` = c(NA_real_, NA_real_, NA_real_, NA_real_, NA_real_, NA_real_),
`20874287_102MR` = c(NA_real_, 15.091, 15.187, 15.282, NA_real_, NA_real_),
`20874299_54MR` = c(NA_real_, 15.378, 15.378, NA_real_, NA_real_, NA_real_),
`20874316_AIR_90MR` = c(NA_real_, NA_real_, NA_real_,15.091, 15.187, 15.282)),
row.names = c(NA, 6L), class = "data.frame")
Время не имеет значения. Пока есть запись в этот день, я могу считать ее столбцом с записями за 1 день.
Окончательный результат должен содержать общее количество дней для каждого столбца.
Это то, что вы хотите сделать?
library(dplyr)
df %>%
group_by(date = as.Date(Date_Time_GMT_3)) %>%
summarise(across(everything(), ~any(!is.na(.)))) %>%
summarise(across(-date, sum))
#> # A tibble: 1 x 6
#> Date_Time_GMT_3 `20874285_33MR` `20874290_103MR` `20874287_102MR` `20874299_54MR` `20874316_AIR_90MR`
#> <int> <int> <int> <int> <int> <int>
#> 1 5 5 0 3 2 2