y_test.shape
выход: (40,)
predict.shape
выход: (40,1)
confusion_matrix(y_test, predict)
Ошибка: ValueError: Метрики классификации не могут обрабатывать сочетание двоичных и непрерывных целей.
Я применяю метрику путаницы при прогнозировании модели CNN на текстовых данных, но появилось сообщение об ошибке, что матрица путаницы не может обрабатывать смесь двоичных и непрерывных данных.
Мне нужно увидеть образец того, как выглядят y_test
и predict
.
Иногда это происходит, когда классификатор выдает квазивероятностные оценки, например, когда в нейронной сети используется кроссэнтропийная потеря.
import numpy as np
y_test = np.array([0, 1, 0])
y_pred = np.array([[0.1], [0.7], [0.2]])
print(y_test.shape, y_pred.shape)
# (3,) (3, 1)
Это решается пороговой обработкой прогнозов. 0,5 - это общий выбор:
from sklearn.metrics import confusion_matrix
confusion_matrix(
y_test,
(y_pred > 0.5),
)
# array([[2, 0],
# [0, 1]])
кто-нибудь может сказать, почему я получаю ошибку?