Ошибка матрицы путаницы sklearn?

Я проводил тест с sklearn.metrics.confusion_matrix, чтобы увидеть, что произойдет, если в массиве предсказания есть класс, которого нет в массивах меток и сопоставлений. Мой код:

from sklearn.metrics import confusion_matrix as cm

a = ["positive\n", "positive\n", "negative\n", "positive\n", "negative\n"]
b = ["negative\n", "negative\n", "don't\n", "negative\n", "negative\n"]
m = ["positive\n", "negative\n"]
c = cm(a, b, m)
TN, FP, FN, TP = c.ravel()

print(c)
print("")
print("{} {} {} {}\n".format(TN, FP, FN, TP))

Результат:

[[0 3]
 [0 1]]

0 3 0 1

Итак, урок don't пропущен.


Но если вы посмотрите на документация для версии v0.21.2, которую я установил, метод ravel() «должен» выводить значения матрицы путаницы, как я написал: TN, FP, FN, TP. Вывод моего print отличается. Кажется, что реальный вывод ravel() перевернут: TP, FN, FP, TN. Верна ли моя мысль?

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
0
372
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Нет никакой ошибки. Вы определили ярлыки:

m = ["positive\n", "negative\n"]

поэтому "positive\n" отрицательное, а "negative\n" положительное. И результат соответствует вашей спецификации.

Если вы измените m таким образом:

m = ["negative\n", "positive\n"]

ты получишь:

1 0 3 0

для TN, FP, FN, TP соответственно.

поэтому в случае двоичной классификации первый класс в массиве сопоставления должен быть «отрицательным» классом, чтобы получить правильные результаты ravel(), иначе я должен поменять местами возвращаемые значения? Но в итоге тот же результат, верно?

User 30.05.2019 12:04

Нет ничего правильного или неправильного как такового. Чтобы понять процесс, постройте матрицу, где строки — это истинные классы, а столбцы — предсказанные классы. Затем заполните матрицу относительно предсказанных и истинных значений. И вы получите результат.

sentence 30.05.2019 13:03

Другие вопросы по теме