Разница между обучающими наборами и проверочными наборами?

Я изучаю машинное обучение, и я часто сталкивался с людьми, разделяющими свои данные на «обучающий набор» и «набор для проверки». Я никогда не мог понять, почему люди никогда просто не использовали все данные для обучения, а затем просто использовали их снова для проверки. Есть ли причина, по которой я скучаю?

Это более глубокий вопрос, и он определенно не для StackOverflow. Попробуйте обмен стеком Перекрестная проверка.

Dawid Laszuk 27.03.2018 06:02

Потому что каждая викторина проста, если вы уже знаете ответы?

Robby Cornelissen 27.03.2018 06:11
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
6
2
184
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Подумайте об этом так: вы собираетесь сдавать экзамен и усердно практикуетесь со своими практическими материалами. Вы ведь не знаете, что вас спросят на экзамене?

С другой стороны, если вы будете практиковаться с самим экзаменом, когда вы будете сдавать экзамен, вы будете знать все ответы, так что вам даже не придется учиться.

Так обстоит дело с вашей моделью: если вы тренируете свою модель как на наборе поездов, так и на тестовом наборе, ваша модель будет знать все ответы заранее. Вам нужно дать ему то, чего он не знает, чтобы он мог вывести вам некоторые ответы.

По сути, вы хотели бы, чтобы модель обучалась с использованием набора данных поезда, чтобы проверить, правильно ли выполнена настройка гиперпараметров, вы хотели бы протестировать ее с частью набора данных.

Если это было сделано непосредственно на тестовых данных, высока вероятность переобучения. Чтобы избежать этого, вы используете набор данных проверки и измеряете производительность вашей модели по сравнению с набором тестовых данных.

Другие вопросы по теме