Как измерить частоту совпадения слов

Как определяется частота повторения слов?

Это количество раз, когда два слова встречаются вместе / общее количество документов в корпусе?

ИЛИ

количество раз, когда два слова встречаются вместе / (количество раз появления первого слова + количество раз появления второго слова)?

в зависимости от ваших потребностей вы можете рассчитать его по-разному, я рассчитывал его как number of times two words appear together / number of first word appears

Iłya Bursov 05.03.2019 02:13
Тонкая настройка GPT-3 с помощью Anaconda
Тонкая настройка GPT-3 с помощью Anaconda
Зарегистрируйте аккаунт Open ai, а затем получите ключ API ниже.
0
1
49
1

Ответы 1

«Модель GloVe обучается на ненулевых элементах глобальной матрицы совпадения слов, которая показывает, как часто слова встречаются друг с другом в данном корпусе». - от https://nlp.stanford.edu/projects/glove/ (издатели GloVe). Я предполагаю, что вы имеете в виду совместное появление, используемое моделями GloVe. Математически: https://towardsdatascience.com/emnlp-what-is-glove-part-ii-9e5ad227ee0 У вас есть P(i|j) = Xij/Xi w/ Xij = количество совпадений, а Xi = количество раз, когда любое слово появляется в контексте слова i. Обратите внимание, Xi = Sum_k Xik, где k — каждое слово.

Другие вопросы по теме