Использование Nest для динамической разметки поля в поля завершения на восточных языках

Мне нужна помощь по разметке поля на несколько входов в C#, где ввод находится на юго-восточном языке (тайском).

Таким образом, я могу вставить список строк этих слов во вход предложения и создать правильное завершение. Я не уверен, смогу ли я использовать Nest или мне придется комбинировать свое решение с icu.net или Lucene.Net.ICU

Заранее спасибо

Я бы посоветовал изучить пакет NLP [обработка естественного языка]. Я использую Стэнфордское НЛП, оно может токенизировать и делать многое другое.

— 31.05.2018 16:36

c# elasticsearch nest

31.05.2018 15:05

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

108

Ответы 1

Подключаемый модуль Elasticsearch ICU Analysis интегрирует модуль Lucene ICU в Elasticsearch. Вы можете настроить сопоставление полей для использования настраиваемого анализатора, настроенного с помощью icu_tokenizer, и других конфигураций для конкретных вариантов использования, которые вам требуются.

Если вам требуются возможности, выходящие за рамки поддерживаемых интеграций, вам, возможно, придется взглянуть на пакеты и подходы NLP, как предложил Вурд в комментариях.

Это позволит мне преобразовать одно поле, скажем, имя в список предложений на лету?

— 05.06.2018 08:29

Я не уверен на 100%, о чем вы спрашиваете. Что вы имеете в виду под предложениями? Нравится предложения автозаполнения? Если да, то это действительно зависит от ожиданий автозаполнения, например. завершение префикса, завершение любого термина в тексте и т. д. Но да, поле text или completion можно использовать для предложений с разным уровнем сложности предложения

— 05.06.2018 09:11

да, я имею в виду автозаполнение, и я знаю, как его настроить. Но я застрял при попытке преобразовать feild (например, Name) в список массивов с помощью icu_tokenizer

— 06.06.2018 07:37

Зачем нужно преобразовывать поле в список массивов?

— 06.06.2018 07:50

чтобы автозаполнение корректно работало с азиатским языком. Я много тестировал, и автоматическое предложение не будет работать, если оно не токенизирует слова должным образом. А на тайском языке нет пробела для токенизации.

— 08.06.2018 10:00

Вы пробовали создать собственный анализатор, который использует компоненты анализа из плагина ICU Analysis, и подключить его как анализатор для автозаполнения?

— 08.06.2018 11:33

Я сделал это, но проблема в том, что если человек начинает печатать со вторым словом вместо начала префикса, его не найти. Это одно из требований. Но если я нарежу слово и сделаю его списком предложений, тогда все в порядке :)

— 08.06.2018 11:45

Похоже, что подсказка завершения может быть не лучшим подходом в этом случае, и что поиск по полю text может быть лучше. Если анализ вне подхода к индексации работает для вас, продолжайте :)

— 08.06.2018 11:54

спасибо, так и думал. Не знаю, что окажется быстрее? Если у нас есть текущая работа по индексации ... будет ли автозаполнение быстрее? Еще раз спасибо! : D

— 08.06.2018 12:26

01.06.2018 02:01