Azure DataFactory — можем ли мы заказать источник CopyData перед приемом?

У меня есть случай, когда мне нужно загрузить файлы CSV в CosmosDb. Итак, у меня есть один набор данных для обработки CSV, а другой — для подготовки схемы CosmosDb.

В процессе у меня есть сопоставление задачи CopyData из CSV, а затем запись в Cosmos. В параметре CopyData Source я указываю хранилище BLOB-объектов Azure, в котором хранятся файлы CSV.

До сих пор не было никаких проблем. Дело в том, что теперь мне нужно найти способ гарантировать, что большие двоичные объекты будут приниматься как массив файлов в алфавитном порядке (на основе имени файла).

Есть ли способ?

Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
0
326
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Трудно сортировать по именам файлов в ADF.

Один из способов достижения:

Сохраните все ваши имена файлов в файле csv, затем используйте операцию сортировки в потоке данных и перезапишите этот файл. Наконец, используйте действия Lookup и For Each, чтобы скопировать большие двоичные объекты в Cosmos DB.

Другой путь:

Передайте дочерние элементы выходных данных действия "Получить метаданные" в функцию Azure. Затем отсортируйте имена файлов в функции Azure. Наконец, зациклите вывод функции по действию «Для каждого» и скопируйте в Cosmos DB.

На самом деле необходимость сортировки по имени файла скрывает простую необходимость сначала принять первый сохраненный большой двоичный объект. Это реальная потребность. В настоящее время без какого-либо дополнительного процесса он, похоже, не загружает первый загруженный большой двоичный объект. Я думаю, что оба варианта будут работать, я бы выбрал «второй путь», потому что я не могу использовать DataFlow (недоступно в Китае). Мы просто знаем, как ADF извлекает данные из учетной записи хранилища? На основании какого приказа?

Doshibu 15.12.2020 17:13

Итак, вам нужно получить BLOB-объект, который раньше всего был загружен в одну папку?

Steve Johnson 16.12.2020 03:44

Другие вопросы по теме

Приложение Azure Logic — сохраните ImageDataURI как изображение в службе хранилища Azure
Как отслеживать ежедневные входящие файлы данных в файлах Azure и сохранять их в базе данных SQL
Исправление для политики ограничения сети учетной записи хранения Azure
Приложение-функция с интеграцией виртуальной сети не может развернуться при настройке WEBSITE_CONTENTAZUREFILECONNECTIONSTRING на хранилище за брандмауэром
Просмотр очереди сообщений лазурного хранилища завершается сбоем с помощью python, но работает через портал
AzureStorage: серверу не удалось аутентифицировать запрос. Убедитесь, что значение заголовка Authorization сформировано правильно, включая подпись
Как скопировать всю структуру между учетными записями хранения в python
Как отфильтровать определенные значения в хранилище таблиц Azure в столбце?
Azure SDK IoT Storage без ключа учетной записи в той же среде в агенте
Проблема с получением большого двоичного объекта из хранилища Azure: Spring Boot