Power BI Desktop поддерживает загрузку одного файла паркета из ADLS,
Прямо сейчас наш процесс будет сбрасывать несколько файлов паркета в папку. В папке будут вложенные папки с файлами другого формата, например json или crc.
Моя проблема в том, что я хочу указать папку в качестве входных данных и загрузить только файлы паркета.
Если я попытаюсь использовать разъем для ADLS Gen 2,
он также загружает файлы json и crc во вложенную папку,
Как я могу выборочно игнорировать и загружать только .parquet
файлы?
Вы можете фильтровать на основе расширения в Power Query
let
Source = Folder.Files("Location"),
FilteredData = Table.SelectRows(Source, each ([Extension] = ".parquet"))
in
FilteredData
весь ваш контент будет в столбце контента. Если вас интересуют только данные, щелкните правой кнопкой мыши контент и нажмите «Удалить другие столбцы», затем разверните столбец «Контент».
Спасибо, Сай! Я использовал запрос, и он смог отфильтровать только файлы паркета. Но контент по-прежнему является метаданными. т. е. в таблице есть столбцы с именем файла, датой создания, доступа и т. д. На самом деле она не объединяет содержимое всех файлов паркета. Принимая во внимание, что если я использую один паркет в качестве источника, отображается содержимое этого файла. Возможно, вариант использования не поддерживается?