БЛОГ Языковые результаты немного отличаются

Я пробую Байесовско-логический язык, используя следующий пример.

Рак молочной железы есть у 1% женщин (и, следовательно, у 99% его нет).
80% маммограмм выявляют рак молочной железы, когда он есть (и, следовательно, 20% пропускают его).
9,6% маммограмм выявляют рак груди, когда его нет (и, следовательно, 90,4% правильно дают отрицательный результат).

Я создал следующий код:

random Boolean Has_Cancer ~ BooleanDistrib(0.01);
random Boolean Detect_Cancer ~ 
    if Has_Cancer then BooleanDistrib(0.8)
    else BooleanDistrib(0.096);

obs Detect_Cancer = true;

query Has_Cancer;

Когда я запускаю его, я получаю следующие результаты:

======== Query Results =========
Number of samples: 10000
Distribution of values for Has_Cancer
    false   0.9245347606896278
    true    0.07546523931038764
======== Done ========

Согласно блогу true должно быть 0.0776.

Когда я запускаю 100 образцов, я получаю следующее:

======== Query Results =========
Number of samples: 100
Distribution of values for Has_Cancer
    false   0.9223602484472041
    true    0.077639751552795
======== Done ========

Я просто пытаюсь понять, почему.

Ага! Да, это имеет больше смысла. Спасибо.

— 21.03.2019 05:18

java bayesian

18.03.2019 18:54

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Значения, генерируемые BLOG, являются точечными оценками после создания случайных выборок из условной вероятностной графической модели с использованием алгоритма взвешивания правдоподобия (LWA). Отличия от аналитических значений в примере поста, вероятно, связаны с шумом от процесса случайной выборки.

Что может сбивать с толку, так это то, что BLOG по умолчанию инициализирует генератор случайных чисел одним и тем же фиксированным начальным числом, и поэтому результаты вводят в заблуждение, как будто они детерминированы. Если вы добавите флаг --randomize к вызову запуска, вы увидите результаты использования других случайных семян.

Я не знаю теоретических свойств LWA (например, насколько сильно он ограничивает апостериорные средние значения), но, по крайней мере, для наивной схемы генеративной выборки средние значения, которые вы генерируете, находятся в пределах 95% ДИ. Вот пример Python, имитирующий 1000 прогонов 10 000 сэмплов.

import numpy as np
from scipy.stats import binom

np.random.seed(2019)

N, K = 10000, 1000
tp = np.empty(K)

for i in range(K):
    t = binom(n=N, p=0.01).rvs()
    f = N - t
    detect_t = binom(n=t, p=0.800).rvs()
    detect_f = binom(n=f, p=0.096).rvs()
    tp[i] = detect_t / (detect_f + detect_t)

np.quantile(tp, [0.025, 0.5, 0.975])
# array([0.06177242, 0.07714902, 0.09462359])

22.03.2019 19:32

Другие вопросы по теме

Параметры Дирихле не обновляются в JAGS

Диагностика конвергенции с помощью Гельмана-Рубина PSRF: пакет R coda и Runjags

Как реализовать тип оценки максимального правдоподобия 2?

Код для базового иерархического байесовского анализа

Предыдущая смесь не работает в JAGS, только когда включен термин вероятности

Несоответствие размеров при инициализации массива (JAGS)

Ключевое преимущество байесовской сети

Pyro: простой инверсный графический пример с использованием SVI не работает

Ошибки при использовании функции ABC_mcmc:

Как построить байесовскую имитационную модель для трехкратного подбрасывания монеты

БЛОГ Языковые результаты немного отличаются

Ответы 1

Другие вопросы по теме

Похожие вопросы