Я слышал рекомендации использовать файл формата Parquet, когда выбираются только некоторые столбцы набора данных (из-за его столбчатого формата хранения).
Но как насчет выборки всех столбцов? Если у меня есть структурированный набор данных, сохраненный в файле parquet в hdfs, и я хочу получить все столбцы, есть ли преимущества от использования файла parquet?
Сказав это, ваш вопрос кажется немного широким, поэтому не удивляйтесь, когда приходит не так много ответов.
Другие пользователи отметили ваш вопрос как низкое качество и необходимость улучшения. Я переформулировал / отформатировал ваш ввод, чтобы его было легче читать / понимать. Просмотрите мои изменения, чтобы убедиться, что они отражают ваши намерения. Не стесняйтесь писать мне комментарий, если у вас есть дополнительные вопросы или отзывы для меня.