Все вопросы с тегом Reinforcement Learning

Обучение с подкреплением — это область машинного обучения и информатики, связанная с тем, как выбрать действие в состоянии, которое максимизирует числовое вознаграждение в конкретной среде.

Страница 1 из 45

Связанные теги

Python
Python — это мультипарадигмальный, динамически типизированный, многоцелевой язык программирования. Он разработан для быстрого изучения, понимания и использования, а также для обеспечения чистого и единообразного синтаксиса. Обратите внимание, что Python 2 официально не…
Вопросы303213
Pytorch
PyTorch — это среда глубокого обучения, которая реализует динамический вычислительный граф, который позволяет вам изменять поведение вашей нейронной сети на лету и может выполнять обратное автоматическое дифференцирование.
Вопросы3071
Stable Baselines
Вопросы7
Stablebaseline3
Вопросы1
Gymnasium
См. Гимназия .
Вопросы2
Tensorflow
TensorFlow — это библиотека с открытым исходным кодом и API, разработанная для глубокого обучения, написанная и поддерживаемая Google.
Вопросы16895