Совместное использование withTaskGroup и async let

Ниже приведена упрощенная версия того, как я использую withTaskGroup:

let allResults = await withTaskGroup(of: ([Double], Float, Float, Int).self,
                                     returning: FinalResult.self,
                                     body: { taskGroup in

    for operation in operations {
        taskGroup.addTask { @MainActor in
            let value = await operation.execute()
            return value
        }
    }
    
    // Collect child task results here...
})

Функция execute выглядит следующим образом, когда процессы включают довольно интенсивные математические вычисления, такие как извлечение признаков для модели машинного обучения:

func execute() async -> ([Double], Float, Float, Int) {
    async let result0: [Double] = process0() ?? []
    async let result1: Float = process1() ?? -1
    async let result2: Float = process2()
    async let result3: Int = process3()
    return (await result0, await result1, await result2, await result3)
}

Проблема, с которой я сталкиваюсь, заключается в том, что окончательный результат непостоянен, иногда я получаю правильные результаты, а иногда нет. Например, иногда я получаю массив всех нулей для 512 функций (длина массива), когда они должны быть ненулевыми числами. Наоборот, если бы я просто использовал for loop вместо withTaskGroup, результат был бы более последовательным.

Поэтому мне интересно, есть ли какие-либо последствия использования withTaskGroup и async let вместе, поскольку это параллель параллели. В отличие от параллелизма, мое понимание параллелизма заключается в том, что каждое ядро ЦП назначается для одновременной обработки задач, но если бы я предоставил 4 operations, это означает, что 4 x 4 = 16 параллельных процессов, что больше, чем количество доступных ядер.

Не должно быть проблем с async let в связке с группами задач. Ваша проблема скорее всего в другом. Я бы предложил создать минимальный воспроизводимый пример проблемы.

— 11.04.2023 02:41

В Swift Concurrency параллель или нет не может быть определена таким образом. Это решает исполнитель Актера и задача требует контекста. И если вы хотите спроектировать высокопроизводительное выполнение параллелизма. Вы должны использовать libDispatch's DispatchQueue.concurrentPerform(iterations:execute:) с выделенной синхронизацией. На самом деле, swift Concurrency не предназначен для параллельного выполнения. TaskGroup довольно медленный для большого параллельного выполнения.

— 11.04.2023 03:11

@ Арбуз, могу ли я использовать DispatchQueue.concurrentPerform(iterations:execute:) вместе с асинхронным ожиданием?

— 11.04.2023 14:32

FWIW, если у вас есть гонки данных, как предполагает Роб Нейпир, переход на concurrentPerform ничего не сделает, чтобы это исправить. А в хорошо спроектированном параллельном коде (где вы «шагаете», чтобы максимизировать работу за итерацию) разница между concurrentPerform и группой задач становится в значительной степени несущественной. Кроме того, в целом, если вы много работаете с CoreML, преимущества параллелизма в ЦП несколько уменьшаются, когда вычисления связаны с ГП или НС.

— 11.04.2023 19:19

Отвечая на ваш вопрос, технически вы можете использовать concurrentPerform в сочетании с async-await. Но это не идеально, потому что кооперативный пул потоков больше не может рассуждать об использовании ЦП, если у вас есть GCD, связывающий ядра. Если вы на самом деле не используете совместный пул потоков во время использования concurrentPerform, это, вероятно, минимальная проблема. Но, как я уже сказал, мои эмпирические сравнения между хорошо спроектированными concurrentPerform и целевыми группами в любом случае показывают очень скромные преимущества. Кроме того, вам, вероятно, следует сначала исправить проблемы с гонкой данных (или что-то еще).

— 11.04.2023 19:23

@Роб Большое спасибо. Это очень информативно.

— 11.04.2023 19:28

ios swift concurrency parallel-processing

10.04.2023 22:11

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Это определенно не проблема. Проблема гораздо более вероятна в том, что ваш код в process1() и т. д. не является потокобезопасным (например, полагаясь на данные, считанные из свойств, которые не являются потокобезопасными, или манипулирует возвращаемым массивом недопустимым образом). Превышение количества ядер не вызовет логической проблемы, если вы правильно написали код. Это может вызвать проблемы с производительностью, в зависимости от многих факторов, но не вызовет проблем с корректностью.

Вы можете включить «Строгую проверку параллелизма» в настройках сборки, что может помочь вам найти ошибки. (Он также может найти множество проблем в Foundation, которые вы не можете исправить, поэтому иногда лучше использовать его для изолированного кода или небольшого проекта.)

Спасибо. Я попробую настройку проверки Strict Concurrency. Всегда ли это может быть связано с гонкой данных?

— 11.04.2023 01:18

Нет, есть несколько возможных ошибок. Это зависит от того, что находится в коде process. Но, учитывая ваше описание, первое, что я предполагаю, это то, что вы обращаетесь к данным между потоками недопустимым образом.

— 11.04.2023 03:32

10.04.2023 23:39