В настоящее время я работаю с довольно большим набором данных и ищу подмножество некоторых из моих переменных.
По сути, я пытаюсь выбрать диапазон переменных, затем добавить одну переменную в эту функцию и вернуться к выбору диапазона.
Например:
items_data = subset(dataset, select = q1:19, q20, q33:35, q50)
Однако я думаю, что запятые вызывают некоторые проблемы.
Я рылся в сети в поисках решения, но наткнулся только на более громоздкие сценарии, и я знаю, что есть более простое решение.
Любая помощь будет принята с благодарностью.
Спасибо!





Вы можете сделать следующее:
База R
items_data = dataset[,c(1:20, 33:35, 50)]
Dplyr
#install.packages('dplyr')
library(dplyr)
items_data = select(dataset, 1:20, 33:35, 50)
обратите внимание, что числа представляют собой позиции индекса столбца, если ваш набор данных изменится, то столбцы, которые он будет извлекать, изменятся. Вместо этого вы также можете использовать имена столбцов, чтобы гарантировать, что если ваш набор данных изменится, он продолжит извлекать те же поля.
Dplyr, это также будет работать с именами столбцов: items_data = select(dataset, q1:q20, q33:q35, q50) (при условии, что столбцы в порядке - он использует порядок таблиц, а не числовые значения)
Большое спасибо за помощь Мэтту У. и MrFlick! Сработало очень хорошо.
Нет проблем @Darko
Думаю, c (q1: q19, q50) подойдет.