Есть данные 4mc по HDFS. Когда я использую Flink env.readTextFile ("hdfs: //127.0.0.1: 8020 / search_logs / 4mc")
Он не может знать сжатый формат, поэтому есть ли у Flink связанный API для реализации для обработки данных сжатого формата такого рода?
Спасибо.
readTextFile, если для текстовых файлов. Ваши файлы сжимаются, вам нужно читать двоичные файлы. Я не думаю, что есть готовое решение для файла 4mc во flink. Но вы можете реализовать свой собственный FileInputFormat и использовать функцию readFile