Я создал алгоритм, который возвращает двоичную классификацию как вероятности, вот результат прогноза:
pred = [0.0139619, 0.986038]
Теперь мне нужно усреднить эти два значения и получить скаляр от 0 до 1, который суммирует предсказанные вероятности, просто в качестве примера:
averaged_pred = 0.974 # In range 0 to 1
Как я могу реализовать это?
Это просто пример, мне нужно получить среднее значение между обоими классами, я это уже видел, но я не уверен, какой должна быть функция. Идея состоит в том, что average
является скалярным значением, оно будет 0
, если pred = [100, 0]
, и 1
, если pred = [100]
, но я запутался в процедуре.
может быть, использовать энтропию -p*ln(p)? Это будет около 0,69, если вероятности равны 0,5 и 0,5 и ухудшаются от этого до близкого к 0 в случае [0,1].
Очень сложно понять, что вы на самом деле пытаетесь сделать, так как есть много других переменных, о которых мы должны знать. Например, какое значение в массиве истинно, а какое ложно.
Я постараюсь объяснить, предполагая, что 0,0139619 — это правда:
В бинарной классификации у вас есть данные для истинного и ложного. Теперь в двоичном формате истина представлена как 1, а ложь представлена как 0, поэтому двоичный код состоит только из 0 и 1.
Теперь постройте распределение вероятностей с этими значениями. Ну, правда, у нас нет числа, но есть значение; true, а в двоичном формате true равно 1. Итак, мы делим значение 1 на вероятность в процентах. Это оставило бы нас с 1/98,6038. Теперь мы можем сделать то же самое для false. Ложь в двоичном формате равна 0, поэтому мы можем сделать 0/1,39619. Наконец, поскольку мы пытаемся получить среднее значение, мы складываем их вместе. Это дает нам среднюю вероятность между двумя биномиальными значениями.
Чтобы сделать это в python, нам просто нужно создать цикл for:
pred = [0.0139619, 0.986038] #The Probablility From Binary Classification
quantity = [1, 0] #The Values Of The Widgits, Here It Is True And False
for i in pred:
indx = pred.index(i)
prob_individual += (quantity[indx] / (i * 100))
print(prob_individual)
По сути, это выясняет, каково значение pred и каково значение количества. Он выполняет вычисления и каждый раз добавляет их к переменной с именем prob_individual. В конце он печатает это значение.
Спасибо! Это именно то, что я искал. :)
Без проблем! Надеюсь, вы закончите свое машинное обучение!
Как в среднем
0.974
. Хочешь средний по классу? Если вы усредняете вероятности0
и1
, всегда будет0.5