Загрузил почти 50 ГБ CSV-файла в кластер Hadoop, и я хочу увидеть несколько образцов записей для идентификации столбцов.
я пытался использовать
hadoop fs -cat employees.csv | head -n 10
Мои вопросы
head -n 10 - он загрузит 50 ГБ данных и отфильтрует первые 10 строк? как это работает?




Это зависит от вашей версии.
Для более старых версий Hadoop (< 3.1.0):
hadoop fs -cat employees.csv | head -n 10
Для более новых (>= 3.1.0) версий Hadoop
hadoop fs -head employees.csv
спасибо за ответ. я использую версию <3.1.0. в этом случае я должен использовать эту команду: hadoop fs -cat employee.csv | head -n 10 - как это будет работать.. загрузка всех данных и выполнение команды head или время загрузки. нужно проверить производительность..