У меня есть поток интеграции, настроенный с использованием Java DSL, который извлекает файл с Ftp-сервера с помощью Ftp.inboundChannelAdapter
, затем преобразует его в JobRequest
, затем у меня есть метод .handle()
, который запускает мое пакетное задание, все работает в соответствии с требованиями, но процесс выполняется последовательно для каждого файла внутри FTP-папки
Я добавил currentThreadName
в свою конечную точку Transformer, он печатал одно и то же имя потока для каждого файла.
Вот что я пробовал до сих пор
1.компонент-исполнитель задач
@Bean
public TaskExecutor taskExecutor(){
return new SimpleAsyncTaskExecutor("Integration");
}
2. поток интеграции
@Bean
public IntegrationFlow integrationFlow(JobLaunchingGateway jobLaunchingGateway) throws IOException {
return IntegrationFlows.from(Ftp.inboundAdapter(myFtpSessionFactory)
.remoteDirectory("/bar")
.localDirectory(localDir.getFile())
,c -> c.poller(Pollers.fixedRate(1000).taskExecutor(taskExecutor()).maxMessagesPerPoll(20)))
.transform(fileMessageToJobRequest(importUserJob(step1())))
.handle(jobLaunchingGateway)
.log(LoggingHandler.Level.WARN, "headers.id + ': ' + payload")
.route(JobExecution.class,j->j.getStatus().isUnsuccessful()?"jobFailedChannel":"jobSuccessfulChannel")
.get();
}
3. Я также прочитал в другом потоке SO, что мне нужно ExecutorChannel
, поэтому я настроил его, но я не знаю, как внедрить этот канал в мой Ftp.inboundAdapter
, из журналов видно, что канал всегда integrationFlow.channel#0
, который, я думаю, является DirectChannel
@Bean
public MessageChannel inputChannel() {
return new ExecutorChannel(taskExecutor());
}
Я не знаю, чего мне здесь не хватает, или, возможно, я неправильно понял систему обмена сообщениями Spring, поскольку я очень новичок в Spring и Spring-Integration.
Любая помощь приветствуется
Спасибо
ExecutorChannel
вы можете просто внедрить в поток, и он будет применен к SourcePollingChannelAdapter
фреймворком. Итак, определив этот inputChannel
как bean-компонент, вы просто делаете следующее:
.channel(inputChannel())
перед вашим .transform(fileMessageToJobRequest(importUserJob(step1())))
.
Подробнее см. в документах: https://docs.spring.io/spring-integration/docs/current/reference/html/dsl.html#java-dsl-channels
С другой стороны, для параллельной обработки ваших файлов в соответствии с вашей конфигурацией .taskExecutor(taskExecutor())
вам просто нужно иметь .maxMessagesPerPoll(20)
как 1
. Логика в AbstractPollingEndpoint
такая:
this.taskExecutor.execute(() -> {
int count = 0;
while (this.initialized && (this.maxMessagesPerPoll <= 0 || count < this.maxMessagesPerPoll)) {
if (pollForMessage() == null) {
break;
}
count++;
}
Итак, у нас есть параллельные задачи, но только когда они достигают того maxMessagesPerPoll
, где оно 20
в вашем текущем случае. В документах также есть некоторые пояснения: https://docs.spring.io/spring-integration/docs/current/reference/html/messaging-endpoints.html#endpoint-pollingconsumer
Свойство maxMessagesPerPoll указывает максимальное количество сообщений, которое должно быть получено в рамках данной операции опроса. Это означает, что средство опроса продолжает вызывать функцию receive() без ожидания, пока не будет возвращено значение null или пока не будет достигнуто максимальное значение. Например, если опросчик имеет триггер с десятисекундным интервалом и параметр maxMessagesPerPoll, равный 25, и он опрашивает канал, в очереди которого находится 100 сообщений, все 100 сообщений могут быть получены в течение 40 секунд. Он захватывает 25, ждет десять секунд, захватывает следующие 25 и так далее.
Да, это правильно. Существует как минимум два потока: один для планирования периодической задачи в соответствии с конфигурацией триггера. Еще один (или несколько) для выполнения задачи опроса. Итак, да, когда такая задача опроса выполняется в другом потоке, управление возвращается к планировщику для запуска новой периодической задачи. Технически нисходящий поток ExecutorChannel
даст нам аналогичный побочный эффект — пока мы перемещаем задание в другой поток, планировщик может перейти к следующему циклу опроса.
После того, как я изменил maxMessagesPerPoll
на 1, мое пакетное задание для каждого файла теперь выполняется в другом потоке, даже если у меня нет ExecutorChannel
на месте, поэтому ExecutorChannel
полезно, когда опросчик читает два или более сообщений одновременно и передает их ExecutorChannel
, а затем каналу. обрабатывает каждое сообщение одновременно в другом потоке. ExecutorChannel
не требуется, если для maxMessagesPerPoll
установлено значение 1. Правильно? Просто нужно еще раз прояснить мои сомнения. Я знаю, что вы объяснили то же самое в своем ответе.
Ваше наблюдение правильное: действительно нет необходимости накладных расходов при смещении потоков, если этого достаточно для вашей логики.
Таким образом, метод
taskExecutor()
в pollerspec позволяет опросчику опрашивать сообщения и передавать их другому потоку, после чего опрашивающий поток освобождается для опроса следующего набора сообщений... это то, что он делает?