Концепция стационарности в последовательном решении в обучении с подкреплением

Ниже приведен фрагмент текста из книги «Проблема последовательного решения» в книге «Искусственный интеллект» «Современный подход» Стюарта Рассела и Питера Норвига. Глава 17, раздел 17.1

Stationarity for preferences means the following:

if two state sequences [s0, s1, s2, . . .] and [s0',s1', s2', . . .] begin with the same state (i.e., s0 =s01), then the two sequences should be preference-ordered the same way as the sequences [s1, s2, . . .] and [s1', s2', . . .].

In English, this means that if you prefer one future to another starting tomorrow, then you should still prefer that future if it were to start today instead.

Мне трудно понять последнее утверждение.

На английском это означает, что если вы предпочитаете одно будущее другому, начинающемуся завтра, вы все равно должны предпочесть это будущее, если бы оно началось сегодня.

Любезно элобоарте и объясните.

Я не уверен, но я понимаю: если у вас есть 2 пути, которые вы можете выбрать позже, и вы знаете, что один из них лучше для вас, выберите его СЕЙЧАС

jonatjano 01.08.2018 08:52
Оптимизация производительности модели: Руководство по настройке гиперпараметров в Python с Keras
Оптимизация производительности модели: Руководство по настройке гиперпараметров в Python с Keras
Настройка гиперпараметров - это процесс выбора наилучшего набора гиперпараметров для модели машинного обучения с целью оптимизации ее...
Развертывание модели машинного обучения с помощью Flask - Angular в Kubernetes
Развертывание модели машинного обучения с помощью Flask - Angular в Kubernetes
Kubernetes - это портативная, расширяемая платформа с открытым исходным кодом для управления контейнерными рабочими нагрузками и сервисами, которая...
Udacity Nanodegree Capstone Project: Классификатор пород собак
Udacity Nanodegree Capstone Project: Классификатор пород собак
Вы можете ознакомиться со скриптами проекта и данными на github .
Определение пород собак с помощью конволюционных нейронных сетей (CNN)
Определение пород собак с помощью конволюционных нейронных сетей (CNN)
В рамках финального проекта Udacity Data Scietist Nanodegree я разработал алгоритм с использованием конволюционных нейронных сетей (CNN) для...
Почему Python - идеальный выбор для проекта AI и ML
Почему Python - идеальный выбор для проекта AI и ML
Блог, которым поделился Harikrishna Kundariya в нашем сообществе Developer Nation Community.
1
1
33
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Еще одно определение стационарность из Википедии, которое может помочь понять идею:

In mathematics and statistics, a stationary process is a stochastic process whose unconditional joint probability distribution does not change when shifted in time.

Ключевой концепцией является то, что не меняется при сдвиге во времени. Таким образом, применительно к случаю предпочтений предпочтение должно быть одинаковым независимо от времени, в которое оно было сделано. То есть предпочтение дню 3 должно быть таким же, если вы находитесь во втором дне (завтра) или дне 1 (сегодня).

Другие вопросы по теме