Пытаясь уменьшить размер образа Docker, я заметил, что pip install torch добавляет несколько ГБ. Большая часть этого исходит от [...]/site-packages/nvidia. Поскольку я не использую графический процессор, я бы не хотел устанавливать nvidia вещи.
Вот минимальный пример:
FROM python:3.12.5
RUN pip install torch
(Игнорируем базовые изображения -slim, так как здесь дело не в этом.)
Итоговый размер:
FROM python:3.12.5 -> 1.02GBRUN pip install torch -> 8.98GBRUN pip install torch && pip freeze | grep nvidia | xargs pip uninstall -y -> 6.19GB.Хотя последний пункт уменьшает окончательный размер, все компоненты nvidia по-прежнему загружаются и устанавливаются, что требует времени и трафика.
Итак, как мне установить torch напрямую без nvidia?
Использование --no-deps не является удобным решением из-за других транзитивных зависимостей, которые я хотел бы установить.
Конечно, я мог бы подробно перечислить каждый из них, но, глядя на этот список пакетов, установленных с помощью torch
mpmath
typing-extensions
sympy
nvidia-nvtx-cu12
nvidia-nvjitlink-cu12
nvidia-nccl-cu12
nvidia-curand-cu12
nvidia-cufft-cu12
nvidia-cuda-runtime-cu12
nvidia-cuda-nvrtc-cu12
nvidia-cuda-cupti-cu12
nvidia-cublas-cu12
networkx
MarkupSafe
fsspec
filelock
triton
nvidia-cusparse-cu12
nvidia-cudnn-cu12
jinja2
nvidia-cusolver-cu12
torch
Я бы не хотел вести этот список вручную, поскольку он изменится в будущих версиях torch.






Как (в общих чертах) описано на начальной странице pytorch.org, Torch на PyPI поддерживает Nvidia; используйте индекс download.pytorch.org для колес только с процессором:
RUN pip install torch --index-url https://download.pytorch.org/whl/cpu
Также не забудьте указать несколько заблокированную версию Torch, например.
RUN pip install torch~=2.4.0 --index-url https://download.pytorch.org/whl/cpu
pip install --index-url=https://download.pytorch.org/whl/cpu --extra-index-url https://our-internal-nexus/repository/pypi/simple torch кажется работает! :)
Ой, здорово, спасибо большое! В полученном изображении есть только
2.06GB! Ага, точную версию закрепляю в актуальномDockerfile. В PROD я уже использую другой--index-url, то есть внутренний экземпляр Nexus компании, поэтому пакеты нужно загружать из-за пределов нашего центра обработки данных только один раз. Тем не менее я попытаюсь выяснить, как заставить это решение работать.