ThreadPoolExecutor слишком быстр для задачи, связанной с процессором

Я пытаюсь понять, как работают ThreadPoolExecutor и ProcessPoolExecutors. В этом тесте я предполагал, что задачи, связанные с ЦП, такие как увеличение счетчика, не получат выгоды от выполнения на ThreadPoolExecutors, поскольку он не освобождает GIL и может использовать только один процесс одновременно.

@measure_execution_time
def cpu_slow_function(item):
    start = time.time()
    duration = random()
    counter = 1
    while time.time() - start < duration:
        counter += 1
    return item, counter


def test_thread_pool__cpu_bound():
    """
    100 tasks of average .5 seconds each, would take 50 seconds to complete sequentially.
    """

    items = list(range(100))

    with ThreadPoolExecutor(max_workers=100) as executor:
        results = list(executor.map(cpu_slow_function, items))

    for index, (result, counter) in enumerate(results):
        assert result == index
        assert counter >= 0.0

К моему удивлению, этот тест занимает около 5 секунд. По моим предположениям, это должно занять ~50 секунд, 100 задач в среднем по 0,5 секунды каждая.

Что мне не хватает?

GIL не блокирует весь поток. Ваше предположение о том, что общая продолжительность должна составлять 50 секунд, ошибочно.

— 07.03.2024 12:44

Ваша cpu_slow_function ошибочна. Вы измеряете реальное время. Из-за этого каждая функция будет выполняться одинаково. Даже если GIL задержит одну функцию, скажем, в 10 раз, это повлияет только на значение счетчика. Однако время выполнения будет таким же, как и при многопроцессорной обработке.

— 07.03.2024 13:40

Другими словами: это не функция, привязанная к процессору. Время выполнения практически не зависит от скорости процессора, почти полностью от затраченного времени.

— 07.03.2024 15:33

python concurrency multiprocessing threadpool python-multithreading

07.03.2024 11:00

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

GIL не препятствует одновременному запуску потоков Python. Это только предотвращает выполнение байт-кода более чем одним потоком в любой момент времени.

В любой момент в вашей программе будет один рабочий процесс, который на самом деле находится в процессе выполнения байт-кода, и 99 рабочих процессов, которые все ждут возможности выполнить свой следующий байт-код, а тем временем часы time.time() тикают. (т. е. проходит реальное время) для всех из них.

07.03.2024 13:14

Вы можете увидеть эффект GIL в следующем варианте вашего кода:

from concurrent.futures import ProcessPoolExecutor, ThreadPoolExecutor
from time import perf_counter, time
from os import cpu_count

def func(item: int) -> tuple[int, ...]:
    start = time()
    counter = 1
    while time() - start < 0.5:
        counter += 1
    return item, counter

def main():
    n = max(2, cpu_count() or 2) - 1
    for executor in ProcessPoolExecutor, ThreadPoolExecutor:
        with executor(n) as exe:
            begin = perf_counter()
            for _ in exe.map(func, range(100)):
                pass
            duration = perf_counter() - begin
            print(executor.__name__, f"{duration:.4f}s")

if __name__ == "__main__":
    main()

Для лучшего статистического анализа следует использовать постоянную, а не переменную (псевдослучайную) длительность. Здесь мы используем 0,5 с.

Кроме того, вам необходимо убедиться, что пулы процессов и потоков имеют одинаковый размер. Этот размер основан на количестве процессоров минус 1.

Выход:

ProcessPoolExecutor 7.5492s
ThreadPoolExecutor 7.8219s

Мы видим, что в этом случае многопоточность немного медленнее, чем многопроцессорность, поскольку функция func() полностью привязана к процессору.

Примечание:

Протестировано на Apple Silicon M2, где os.cpu_count() == 8.

07.03.2024 13:31

Другие вопросы по теме

Исправление предупреждений о несоответствии «Sendable» для ImageResource в Swift 5.10

Поведение блокировки строк для временной таблицы в функции PLPGSQL

Параллельная запись postgresql в одну и ту же строку

Как отменить сопрограмму Kotlin и убедиться, что она была отменена

Запись и чтение канала Golang — новое для каналов golang

Как завершить Read(), если новые данные не найдены

Одновременное изменение List<T> из нескольких асинхронных функций в C#

Как предотвратить зависание пользовательского интерфейса в wxpython при выполнении длинной задачи с параллельным будущим

Как я могу решить проблему параллелизма в службе REST в проекте Spring Boot?

Невозможно запустить подмножество целей параллельно с Gnu Make 4.3 (порт MinGW-w64)

ThreadPoolExecutor слишком быстр для задачи, связанной с процессором

Ответы 2

Другие вопросы по теме

Похожие вопросы