Я обучил модель Gensim W2V на 500К предложениях (около 60К) слов, и я хочу вычислить недоумение.
Спасибо
Если вы хотите вычислить недоумение, вам нужно сначала восстановить убыток.
В конструкторе gensim.models.word2vec.Word2Vec
передайте параметр compute_loss=True
- таким образом, gensim
сохранит для вас потерю во время тренировки.
После обучения вы можете вызвать метод get_latest_training_loss()
, чтобы получить потерю.
Поскольку потеря кросс-энтропии в модели скип-грамм, 2 в степени потерь вызовет затруднение. (2 ** убыток)
Вы тренировались? Скажите, в чем заключается недоумение и сколько всего слов в вашем словарном запасе, будет легче определить, имеет ли это смысл
У меня выпадение 36672808.0 имеет смысл?