Почему необходима кривая обучения, чтобы определить, имеет ли нейронная сеть высокое смещение или дисперсию?

В курсе машинного обучения Эндрю Нг рекомендуется построить кривую обучения (размер обучающей выборки в зависимости от стоимости), чтобы определить, имеет ли ваша модель высокое смещение или дисперсию.

Однако я обучаю свою модель с помощью Tensorflow и вижу, что мои потери при проверке увеличиваются, а потери при обучении уменьшаются. Насколько я понимаю, это означает, что моя модель переоснащается, и поэтому у меня большая дисперсия. Есть ли еще причина для построения кривой обучения?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
0
126
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Да, есть, но это не только для определения переобучения. Но в любом случае построение графиков - это просто причудливый способ увидеть числа, и иногда это дает вам понимание. Если вы одновременно отслеживаете потери при поездке / проверке - вы, очевидно, просматриваете одни и те же данные.

Что касается идей Эндрю - я предлагаю изучить его курс Deep Learning, он поясняет, что в современных приложениях (DL + много данных, и я считаю, что это ваш случай) предвзятость не является противоположностью дисперсии.

Другие вопросы по теме