Как выбрать оптимальную сигму для ядра RBF?
Я использую классификатор одного класса, на чем основываться, какие параметры брать
зависит от того, какую платформу машинного обучения вы используете. Если вы используете Weka, доступна опция «поиска по сетке», которая выдает оптимальные параметры классификации. (т.е. для линейного ядра он дает вам функцию стоимости, для RBF-SVM он дает сигму / гамму и C и т.д.)
http://scikit-learn.org/stable/auto_examples/svm/plot_rbf_parameters.html
Если вы используете Python, я обычно перебираю значения сигмы с небольшими шагами и с точностью классификации сосков на каждом шаге. Затем я выбираю сигму, которая дает наилучшую точность. Также обратите внимание, что если вы оптимизируете параметры SVM для данной задачи классификации, вы рискуете переобучиться. Однако изменения итеративного шага должны дать вам лучшее представление о том, где (если таковое имеется!) Происходит переоснащение.
Удачи!
Я бы посоветовал вам использовать какой-то Сетка-поиск. Это метод, при котором вы оцениваете производительность сразу по двум параметрам. Для вашей SVM есть sigma
и C
. Следовательно, вы выполняете исчерпывающий поиск в пространстве параметров, где каждая ось представляет параметр, а точка в нем представляет собой кортеж из двух значений параметра (C_i, sigma_i)
.
Итак, чтобы выполнить это, вы просто выбираете набор для C
: {C_1,..., C_n}
и для sigma
: {sigma_1,..., sigma_n}
и тренируете, а затем тестируете его для каждой пары параметров в двух наборах (C_i, sigma_i)
.
На самом деле это займет довольно много времени, поэтому я предлагаю вам попробовать что-то подобное:
Например, LibSVM предлагает Перекрестная проверка K-Fold, поэтому изобразите набор значений sigma
, определите фиксированный K
(возможно, от 5 до 10) и запустите перекрестную проверку, чтобы получить хорошую оценку C
. Задокументируйте параметр C
и показатель точности. После того, как вы применили это ко всем элементам вашего набора значений sigma
, выберите пару параметров, которые достигли наивысшей точности во время каждой процедуры перекрестной проверки.
Примечание:
Я предлагаю вам не использовать SVM для решения одноклассных задач. Даже если для этого есть формальное определение, базовому алгоритму SVM нужны два класса для определения оптимальной границы. Следовательно, я предлагаю вам создать класс catch-all
и преобразовать вашу проблему с одним классом в проблему с двумя классами.
Я не знаю, как сформулировать данные для oneClass, меня смущают варианты один против одного и один против всех, пожалуйста, помогите мне!
Я же сказал вам: не используйте один класс svm. Вы использовали его в том случае, когда в этом не было необходимости. Вы пробовали решить XOR, это двоичная проблема, поэтому можно использовать базовый svm. Один против всех предназначен только для мультиклассовых задач (более двух классов). Вы просто находите такие ответы с помощью Google.
в github.com/techfort/classify-text/blob/master/node_modules/… решить проблему xor с помощью мультиклассового классификатора C_SVC
я редактирую свой вопрос stackoverflow.com/questions/50421175/training-and-test-with- svm
to oneClass используется nu вместо C
можешь опровергнуть, почему нельзя использовать oneCLass?
Потому что one-Class сложно оптимизировать и обучать. В вашей задаче XOR у вас также есть 2 класса {0,1}. Вы можете обучить свой бинарный классификатор svm als или одноклассный классификатор, и я уверен, что первый превосходит второй.
Nu похож на C, но со значениями от 0 до 1, а не от 1 до бесконечности. Nu кажется труднее оптимизировать, но я никогда не пытался сравнивать его.
бинарный классификатор C_SVC? я использовал эту библиотеку npmjs.com/package/libsvm-js
Nu, C и т. д. Не имеет значения. Серьезно, вы когда-нибудь изучали этот предмет? Я уверен, что вы не добьетесь хороших результатов, если не знаете, как это сделать.
Я сказал это для этой асинхронной функции xor () {const SVM = await require ('libsvm-js'); const svm = new SVM ({kernel: SVM.KERNEL_TYPES.RBF, // Тип ядра, которое я хочу использовать type: SVM.SVM_TYPES.C_SVC, // Тип SVM, который я хочу запустить gamma: 1, // RBF стоимость параметра гаммы ядра: 1 // параметр стоимости C_SVC});
Вы можете ответить на все свои вопросы, просто используя Google. Начни, пожалуйста, изучать тему.