Статьи по программному обеспечению для обработки естественного языка с открытым исходным кодом от Группы НЛП Стэнфордского университета на языках Java, Python и C, включая Stanford CoreNLP, Stanza и GloVe.
Обработка естественного языка (NLP) — это подполе искусственного интеллекта, которое включает в себя преобразование или извлечение полезной информации из данных на естественном языке. Методы включают машинное обучение и подходы, основанные на правилах.
Косинусное сходство — это мера сходства между двумя векторами внутреннего пространства продукта, которая измеряет косинус угла между ними. Это популярная мера сходства между двумя векторами, поскольку она рассчитывается как нормализованное скалярное произведение двух…
Gensim — это бесплатный фреймворк Python, предназначенный для автоматического извлечения семантических тем из документов настолько эффективно (с точки зрения компьютера) и безболезненно (с точки зрения человека), насколько это возможно.
По вопросам о встраивании слов, методике языкового моделирования при обработке естественного языка. Статьи могут касаться конкретных методов, таких как Word2Vec, GloVe, FastText и т. д., Или встраивания слов и их использования в библиотеках машинного обучения в целом.