Как работает Google In Quotes?

Я считаю В кавычках от Google действительно отличным приложением, и, как специалист по CS, я должен понимать, как оно работает. Как, по вашему мнению, он превращает новостные статьи в список цитат, приписываемых конкретным людям? Конечно, есть некоторые ошибки, но их алгоритм кажется более умным, чем простая эвристика или несколько регулярных выражений. Например, цитата может быть приписана кому-то, даже если его / ее имя было упомянуто только в последнем абзаце.

Есть идеи? Есть какие-нибудь известные статьи по этому поводу?

algorithm nlp

25.10.2008 21:25

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

581

Ответы 3

У меня нет бумаги, но есть идея. Google берет цитаты от множества людей. Легко для них с помощью Новостей Google и других средств массовой информации.

У них другой набор предметов. Google сопоставляет набор тем с набором людей (оба набора конечны). Последний набор - это все цитаты,

Если вы заметили, тема содержит 1 слово, выделенное в цитате. Таким образом, существует связь между набором тем и набором цитат для каждой группы людей. Поскольку Google является хозяином информации, должно быть очень легко получить связь между всем этим набором.

25.10.2008 22:17

У меня нет ответа на ваш вопрос, но я предлагаю вам спросить инженера Google напрямую через Модератор Google. Вы можете не получить ответ быстро (или вообще не получить), но там вы получите точный ответ.

26.10.2008 02:45

Это просто, он проверяет слова, но между ними может быть что угодно, если они все еще в порядке. "Привет мир!" станет регулярным выражением / hello [.] * world /

25.12.2008 16:21

Другие вопросы по теме

Natural Language / Text Mining и Reddit / сайт социальных новостей

Tf-idf и ранее невидимые условия

Алгоритмы или библиотеки для анализа текста, в частности: доминирующие слова, фразы в тексте и сбор текста

Что является хорошей отправной точкой для тех, кто интересуется обработкой естественного языка?

Как я могу использовать НЛП для анализа ингредиентов рецепта?

Есть ли удобочитаемый язык программирования?

Как обеспечить, чтобы пользователь отправлял только английский текст

Как я могу разбить несколько соединенных слов?

Скрытое распределение Дирихле, подводные камни, советы и программы

Алгоритм стемминга, производящий настоящие слова

Как работает Google In Quotes?

Ответы 3

Другие вопросы по теме

Похожие вопросы