JAGS: переменное количество кластеров

Я пытаюсь запустить байесовскую модель кластеризации, в которой количество кластеров является случайным с биномиальным распределением. Это моя модель Jags:

model{
    for(i in 1:n){
        y[ i ,1:M] ~ dmnorm( mu[z[i] , 1:M] , I[1:M, 1:M])      
        z[i] ~ dcat(omega[1:M])
    }
    for(j in 1:M){
        mu[j,1:M] ~ dmnorm( mu_input[j,1:M] , I[1:M, 1:M] )
    }
    M ~ dbin(p, Mmax)       
    omega ~ ddirich(rep(1,Mmax))
}

чтобы запустить его, нам нужно определить параметры и начальные значения переменных, что и делается в этом R-скрипте.

Mmax=10

y = matrix(0,100,Mmax)
I = diag(Mmax)
y[1:50,] = mvrnorm(50, rep(0,Mmax), I)
y[51:100,] = mvrnorm(50, rep(5,Mmax), I)

plot(y[,1:2])

z = 1*((1:100)>50) + 1

n = dim(y)[1]

M=2
mu=matrix(rnorm(Mmax^2),nrow=Mmax)
mu_input=matrix(2.5,Mmax,Mmax) ### prior mean
p=0.5

omega=rep(1,Mmax)/Mmax

data = list(y = y, I = I, n = n, mu_input=mu_input, Mmax = Mmax, p = p)

inits = function() {list(mu=mu,
                         M=M,
                         omega = omega) }

require(rjags)
modelRegress=jags.model("cluster_variabile.txt",data=data,inits=inits,n.adapt=1000,n.chains=1)

однако, выполнив последнюю команду, можно получить

Error in jags.model("cluster_variabile.txt", data = data, inits = inits,
:   RUNTIME ERROR: Compilation error on line 6. 
Unknown variable M Either supply values 
for this variable with the data or define it  on the left hand side of a relation.

что для меня не имеет смысла, так как ошибка в строке 6, даже если M уже появляется в строке 4 модели! В чем проблема запуска этого скрипта?

r jags rjags

14.12.2020 18:33

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

171

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Итак, я думаю, что основная проблема заключается в том, что вы не можете изменить размерность стохастического узла, который вы обновляете. Это кажется проблемой для MCMC с обратимым прыжком, хотя я не думаю, что вы можете сделать это в JAGS.

Это значит, что решения нет?

— 18.12.2020 18:53

Думаю не в JAGS. Можно написать функцию, которая обновляется, но я не уверен, что она даст правильный ответ. Один из способов решить эту проблему состоит в том, что, например, если M=2, вы обновляете параметры, относящиеся к 2 группам, относительно данных, но не параметры, относящиеся к любому другому количеству групп. Почти столь же хорошей альтернативой было бы оценить 10 различных решений и посмотреть на DIC или какую-либо другую статистику кластеризации, например C-H или статистику Gap. Наличие апостериорного распределения по # кластерам вызовет апостериорное распределение этих значений.

— 18.12.2020 19:59

18.12.2020 18:21

Ответ принят как подходящий

Таким образом, JAGS не похож на R или другие процедурные языки программирования тем, что на самом деле он не работает построчно, это декларативный язык, означающий, что порядок команд на самом деле не имеет значения, по крайней мере, с точки зрения того, как появляются ошибки. Поэтому то, что он не выдал ошибку в строке 4, не означает, что там тоже что-то не так. Я не уверен, но я считаю, что ошибка возникает из-за того, что JAGS пытается сначала построить массив перед вводом значений, поэтому M фактически не определен на этом этапе, но вы ничего не можете с этим поделать.

Помимо этого, для этого должна быть довольно простая работа, она просто менее эффективна. Вместо того, чтобы зацикливаться от 1:M, сделайте итерацию цикла от 1:MMax таким образом, чтобы размеры фактически не менялись, это всегда MMax x MMax. Затем строка 7 просто присваивает значение 1:M этих позиций. Недостатком этого является то, что вам потребуется выполнить некоторую обработку после того, как модель будет подобрана. Таким образом, на каждой итерации вам нужно будет извлекать выборку M и фильтровать матрицу mu, чтобы она была M x M, но это не должно быть слишком сложно. Дай мне знать, если тебе еще понадобится помощь.

30.12.2020 20:53

Другие вопросы по теме

Как указать отрицательную биномиальную модель с нулевым раздуванием в JAGS

Синтаксическая ошибка при попытке разобрать байесовскую модель с помощью RJAGS

Зазубрины: попытка переопределить ошибку узла, регрессия смешанного эффекта

Перевести логический оператор JAGS != в Stan

Что такое алгоритм зазубрин с дискретным правдоподобием и непрерывным априорным

Модель байесовской бета-регрессии. Ошибка в зазубринах: недопустимое родительское значение

Как бороться с «Несоответствующими параметрами с функцией inprod» в модели JAGS

Как исправить «Узел несовместим с родителями» в R2jags::jags

Как написать файл модели для бинома JAGS, используя функцию логита

Параметры Дирихле не обновляются в JAGS

JAGS: переменное количество кластеров

Ответы 2

Другие вопросы по теме

Похожие вопросы