Я работаю с данными о диабете индейцев пима из Kaggle в Rstudio, и вместо na в качестве отсутствующих значений он имеет 0.
Как я могу подсчитать количество значений «0» в каждой переменной с помощью одного цикла вместо ввода table(data$variableName==0)
для каждого столбца. Просто перефразируя: «один цикл для всего фрейма данных».
Мы можем использовать colSums
на логическом matrix
colSums(data == 0)
Или с sapply
в цикле
sapply(data, function(x) sum(x == 0))
или с apply
apply(data, 2, function(x) sum(x == 0))
Или в цикле for
count <- numeric(ncol(data))
for(i in seq_along(data)) count[i] <- sum(data[[i]] == 0)
Попробуй это:
library(dplyr)
data %>% summarise(across(.fns = ~sum(.==0,na.rm=TRUE) ,.names = "Zeros_in_{.col}"))
Спасибо за быстрый ответ. Я правильно понял, используя предложенный вами код. Еще раз спасибо.