Можно ли сделать вывод, используя предварительно обученную модель тензорного потока из ядра cuda?

Мне нужно сделать вывод, используя модель тензорного потока внутри ядра cuda. Для этого мне понадобятся функции DEVICE для вывода, которые можно вызывать из ядра cuda. Ничего подобного в tensorflow C++ API не нашел.

c++ tensorflow cuda inference

20.03.2019 02:38

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Я ни в коем случае не эксперт по Tensorflow. Но учтите, что выполнение логического вывода на GPU в нетривиальной сети обычно требует нескольких вызовов ядра. Кажется маловероятным, что тот тип API, который вы ищете, существует. Даже учитывая, что теоретически возможен запуск ядер из других ядер (например, с использованием динамического параллелизма), весь смысл Tensorflow заключается в том, чтобы описать ваши вычисления на уровне абстракции, намного превышающем все, что связано с CUDA. Вы используете Tensorflow, чтобы выполнить сопоставление с CUDA за вас. Tensorflow — это, по сути, своего рода компилятор, который переводит ваш вычислительный граф в то, что он считает лучшим способом выполнения вычислений, описываемых графом, на заданном целевом оборудовании. Детали этого вида сопоставления сильно зависят от цели и могут быть изменены. Разоблачение любых подобных вещей в общедоступном API, казалось бы, идет вразрез с самой природой того, чем стремится быть Tensorflow. Конечно, Tensorflow имеет открытый исходный код, поэтому всегда можно просто посмотреть и выяснить, как именно выглядит код устройства, сгенерированный Tensorflow, и как его нужно вызывать. Однако количество усилий, необходимых для этого, скорее всего, непомерно велико; и следовало бы ожидать, что все это сломается с каждой новой версией…

Вместо того, чтобы задавать вопрос о том, как вручную вызывать внутренние компоненты сеанса Tensorflow, более плодотворным подходом может показаться, что Tensorflow вместо этого вызывает вас. Казалось бы, например, с помощью добавление пользовательской операции вы могли бы заставить Tensorflow вызывать код вашего GPU…

20.03.2019 04:07

Другие вопросы по теме

Google colab не находит keras.engine при повторной инициализации весов нейронной сети

Как лучше всего объединить несколько графиков в тензорном потоке?

Инициализация Tensorflow дает все

Преобразование модели нейронной сети Convnet.js в Keras Tensorflow

Tensorflow не может назначить устройство для работы

Ограничения больших входных изображений для трансферного обучения VGG19

Расширение контекста для речевых кадров в tensorflow или keras

Нехватка памяти в реализации нейронной сети (с использованием массива Numpy). Что может оптимизировать загрузку данных?

Ошибка обучения модели YOLO - поднять source.error(msg, len(this) + 1 + len(that)) sre_constants.error: неверный диапазон символов 5-2 в позиции 72

Сборка Tensorflow Docker из исходников

Можно ли сделать вывод, используя предварительно обученную модель тензорного потока из ядра cuda?

Ответы 1

Другие вопросы по теме

Похожие вопросы