Я построил модель SVM, используя пакет R Caret:
set.seed(1234567)
SVM_caret <- train(x = x_train, y = y_train$label,
method = "svmLinear", tuneGrid = expand.grid(
C = c(0.001, 0.01, 0.1, 1)),
metric = "ROC",
trControl = trainControl(method = "cv", number = 3, classProbs = T),
maxit = 100)
Я попытался реализовать код это для построения границы решения моей модели, но получаю несколько ошибок. Это матрица путаницы модели:
Confusion Matrix and Statistics
Reference
Prediction class_1 class_2 class_3 class_4
class_1 9 0 0 0
class_2 0 7 0 0
class_3 3 0 6 0
class_4 0 0 0 7
Overall Statistics
Accuracy : 0.9062
95% CI : (0.7498, 0.9802)
No Information Rate : 0.375
P-Value [Acc > NIR] : 5.706e-10
Kappa : 0.8743
Mcnemar's Test P-Value : NA
Statistics by Class:
Class: class_1 Class: class_2 Class: class_3 Class: class_4
Sensitivity 0.7500 1.0000 1.0000 1.0000
Specificity 1.0000 1.0000 0.8846 1.0000
Pos Pred Value 1.0000 1.0000 0.6667 1.0000
Neg Pred Value 0.8696 1.0000 1.0000 1.0000
Prevalence 0.3750 0.2188 0.1875 0.2188
Detection Rate 0.2812 0.2188 0.1875 0.2188
Detection Prevalence 0.2812 0.2188 0.2812 0.2188
Balanced Accuracy 0.8750 1.0000 0.9423 1.0000
Есть 4 класса для прогнозирования, я не знаю, действительно ли возможно построить этот сюжет, но я не мог понять, как это сделать. Есть ли какая-либо функция или способ визуализировать эту границу решения??
Поскольку я не могу просто скопировать и вставить сюда свои данные, я добавлю ссылку на них на диск Google, чтобы вы могли скачать и воспроизвести проблему, не беспокойтесь о размере, так как он действительно легкий.
Вот ссылки:
Заранее большое спасибо за вашу помощь.
@Humpelsielzchen, спасибо за ответ. нет ли способа представить классы, используя разные цвета или что-то в этом роде, и просто нарисовать граничные линии вокруг?
Я не думаю, что это работает. Какими будут ваши оси? Каждая точка в вашем наборе данных находится в 10-мерном пространстве. Таким образом, вам нужно будет отобразить 10 границ решений, что невозможно на графике.
хорошо @Humpelsielzchen, это звучит достаточно хорошо как ответ. Давайте дадим ему некоторое время, чтобы посмотреть, хочет ли кто-нибудь внести свой вклад в этот вопрос, и если ничего не произойдет, я буду рад, если вы опубликуете свой ответ, чтобы я мог его принять. Большое спасибо за Вашу помощь
Как указано в комментариях:
Вы можете визуализировать границы решений на двумерном графике только при наличии двух предикторов. Однако вы используете 10 предикторов, а это означает, что каждая точка существует в 10-мерном пространстве, и это нельзя изобразить так, как вы намеревались.
Выбор подмножества предикторов для построения графика даст вам возможность построить границы решений, но они не будут разделять данные на вашем графике каким-либо осмысленным образом.
Если вы определенно хотите визуализировать набор правил принятия решений, вы можете создать дерево решений.
dtree <- train(x = svm_data[,-1], y = svm_labels$label,
method = "rpart",
metric = "Accuracy",
trControl = trainControl(method = "cv", number = 3, classProbs = T),
cp = 0.005,
maxdepth = 3)
plot(dtree$finalModel, margin = 0.2)
text(dtree$finalModel)
Привет, Humpelsielzchen, большое спасибо за ваш ответ. Я не знал, что мы можем использовать деревья решений таким образом, чтобы представить какие-то правила принятия решений. Я посмотрю на это. Еще раз большое спасибо :)
Эта функция допускает только два предиктора, что является максимальным количеством измерений, которые вы можете представить на стандартном графике. Если у вас больше предикторов, вы не можете визуализировать границу решения. Если вы хотите визуализировать это, вам, возможно, придется использовать дерево решений.