файл неуклюжий, и я не могу найти способ импортировать работоспособную версию в R. Я пробовал read_csv()
, read_delim()
, readLines()
и readtable()
, но ничего не работает. Некоторые столбцы кажутся разделенными точками, а некоторые — пробелами. Дополнительную информацию об общедоступном наборе данных можно найти здесь.
Дайте мне знать, если вы можете помочь - спасибо!
Сочетание tidyverse и сценариев SAS и SPSS, представленных в документации ABES, может сэкономить время. Например, вы можете использовать ширину из скрипта SPSS с опцией readr::read_fwf()
fwf_cols()
. Например, первые несколько столбцов для передачи в fwf_cols()
будут выглядеть так: Q1 = c(1, 17), Q2 = c(18, 18), Q3 = c(19, 19))
. После того, как он заработает, вы можете проверить свои частоты по Приложению E в Руководстве пользователя данных ABES.
спасибо - можете ли вы дать больше ясности о том, как объединить функцию fwf_cols
с фактическими данными .dat?
Вот как выглядит начало моего кода, но вам, очевидно, потребуется указать ширину для остальных столбцов: df <- readr::read_fwf('ABEH2021_5_RECRUIT.dat', readr::fwf_cols(Q1 = c(1, 17), Q2 = c(18, 18), Q3 = c(19, 19), Q4 = c(20, 20), Q5 = c(21, 28), Q6 = c(29, 32), Q7 = c(33, 38), Q8 = c(39, 39), Q9 = c(40, 40), Q10 = c(41, 41), Q11 = c(42, 42), Q12 = c(43, 43), Q13 = c(44, 44)) #more cols
при использовании readLines, как бы вы хотели, чтобы данные были структурированы? т.е. какой будет первая колонка, вторая колонка и т.д.?