Чрезвычайно высокая загрузка ЦП при обучении модели на графическом процессоре

Недавно я обнаружил кое-что довольно странное с проектом, над которым уже довольно давно работаю. Модель, которая у меня есть, довольно обычна: свёртка с несколькими полносвязными слоями. Для загрузки данных я использую tf.data API, но то же самое происходит с кодом на основе очередей, который у меня был до переноса на tf.data. Через несколько часов после начала обучения модели загрузка ЦП возрастает до очень высокого уровня, 1500–2000%, как сообщает утилита htop. И в начале обучения все нормально, основной процесс показывает только около 200% загрузки ЦП. Прилагается снимок экрана с выходными данными htop, и еще одна вещь, вызывающая беспокойство, - это все дочерние процессы, которые также имеют довольно высокую нагрузку на ЦП.

Я использую tenorflow-gpu версии 1.11, работаю на NVIDIA Tesla V100. Я почти уверен, что модель работает на графическом процессоре, а не на процессоре: nvidia-smi показывает, что графический процессор занят примерно на 70%.

Очевидно, я не могу спросить точную причину этого, и было бы трудно разделить проблему до воспроизводимого тестового примера. Однако, возможно, вы могли бы указать мне на некоторые методы отладки, которые применимы в таком случае.

Чрезвычайно высокая загрузка ЦП при обучении модели на графическом процессоре

Устраняет ли проблему увеличение размера области подкачки?

— 01.12.2018 00:31

python tensorflow

21.11.2018 12:26

Почему в Python есть оператор "pass"?

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

1

1

429

0

Другие вопросы по теме

Как провести нейронную сеть по изображению с помощью тензорного потока?

Anaconda устанавливает tensorflow и fancyimpute

Сравнение возможностей ServingInputReceiver оценщика TensorFlow и Receiver_tensors: когда и почему?

Tf.keras.layers.Concatenate () работает со списком, но не работает с кортежем тензоров

Какой файл содержит мою сохраненную модель глубокого обучения?

Каков размер ядра по умолчанию, нулевое заполнение и шаг для keras.layers.Conv2D?

Как мне найти вывод тензора и / или операции в тензорном потоке? (или «операционные выходы тензорного потока указывают только на себя»)

Ошибка ImageProjectiveTransformV2 при загрузке мета-графа с помощью import_meta_graph

Импорт TensorFlow 1.9.0 на Jupyter Notebook вызывает ошибку

Кому-нибудь удалось использовать комбинацию windows + anaconda + tensorflow?

Похожие вопросы

Сгруппировать массив по первому значению элемента Python

Pandas json_load пропускает десятичные дроби

PySide: QtGui.QFileDialog - проблема пути UNC

Как добавить локальную переменную из функции в массив / список в Python?

Anaconda устанавливает tensorflow и fancyimpute

BeautifulSoup добавляет дополнительные пробелы до и после каждого открывающего и закрывающего тега

Получение значения Python dict

Разделить текст на логические блоки

Точечная диаграмма и пропущенные значения

Область видимости переменной в понимании списка