Spark Java: оптимальный порог, используемый для вычисления ROC в классе Spark BinaryClassificationMetrics

Я использую класс Spark mlib'sBinaryClassificationMetrics для генерации метрик для вывода RandomForestClassificationModel. Я просмотрел документы Spark и могу сгенерировать thresholds, precisionByThreshold, recallByThreshold, roc и pr.

Я хотел знать, используется ли какое-либо конкретное пороговое значение при генерации roc. Это потому, что в Википедия РПЦ говорится, что:

The ROC curve is created by plotting the true positive rate (TPR) against the false positive rate (FPR) at various threshold settings.

Мне было интересно, используется ли какое-либо оптимальное пороговое значение при генерации ROC в Spark. Если нет, то почему?

Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
0
129
1

Ответы 1

Я считаю, что это 0,5, BinaryClassificationMetrics использует BinaryLabelCounter, метод подсчета меток которого выглядит так:

def +=(label: Double): BinaryLabelCounter = {
  // Though we assume 1.0 for positive and 0.0 for negative, the following check will handle
  // -1.0 for negative as well.
  if (label > 0.5) numPositives += 1L else numNegatives += 1L
  this
}

Другие вопросы по теме

Если я выбираю результат pred_proba вместо прогнозирования из модели классификации SVM, означает ли это, что я технически использую классификатор SVM?
Ошибка Spark ML: неверный номер. классов, обнаруженных при использовании Linear SVC
Где находится функция потерь Tensorflow Weighted Cross Entropy loss в функции оценщика классификатора DNN?
Keras - вычисление steps_per_epoch не совпадает с выводом ImageDataGenerator
Оценка точности классификации изображений Python с использованием данных обучения
Несоответствие функций загруженной модели и данных для прогнозирования - scikit learn SVC
Почему сигмоидная и кроссентропия Keras / tensorflow имеет низкую точность?
Классифицируйте строки с уже найденными центрами, python
Оценка точности матрицы неточностей для наборов данных пользователей и производителей неодинаковой длины
Прогнозирование изображения на основе модели CNN всегда возвращает аналогичный (и центрированный) результат