Использование Nest для динамической разметки поля в поля завершения на восточных языках

Мне нужна помощь по разметке поля на несколько входов в C#, где ввод находится на юго-восточном языке (тайском).

Таким образом, я могу вставить список строк этих слов во вход предложения и создать правильное завершение. Я не уверен, смогу ли я использовать Nest или мне придется комбинировать свое решение с icu.net или Lucene.Net.ICU

Заранее спасибо

Я бы посоветовал изучить пакет NLP [обработка естественного языка]. Я использую Стэнфордское НЛП, оно может токенизировать и делать многое другое.

Wurd 31.05.2018 16:36
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
1
108
1

Ответы 1

Подключаемый модуль Elasticsearch ICU Analysis интегрирует модуль Lucene ICU в Elasticsearch. Вы можете настроить сопоставление полей для использования настраиваемого анализатора, настроенного с помощью icu_tokenizer, и других конфигураций для конкретных вариантов использования, которые вам требуются.

Если вам требуются возможности, выходящие за рамки поддерживаемых интеграций, вам, возможно, придется взглянуть на пакеты и подходы NLP, как предложил Вурд в комментариях.

Это позволит мне преобразовать одно поле, скажем, имя в список предложений на лету?

WickStargazer 05.06.2018 08:29

Я не уверен на 100%, о чем вы спрашиваете. Что вы имеете в виду под предложениями? Нравится предложения автозаполнения? Если да, то это действительно зависит от ожиданий автозаполнения, например. завершение префикса, завершение любого термина в тексте и т. д. Но да, поле text или completion можно использовать для предложений с разным уровнем сложности предложения

Russ Cam 05.06.2018 09:11

да, я имею в виду автозаполнение, и я знаю, как его настроить. Но я застрял при попытке преобразовать feild (например, Name) в список массивов с помощью icu_tokenizer

WickStargazer 06.06.2018 07:37

Зачем нужно преобразовывать поле в список массивов?

Russ Cam 06.06.2018 07:50

чтобы автозаполнение корректно работало с азиатским языком. Я много тестировал, и автоматическое предложение не будет работать, если оно не токенизирует слова должным образом. А на тайском языке нет пробела для токенизации.

WickStargazer 08.06.2018 10:00

Вы пробовали создать собственный анализатор, который использует компоненты анализа из плагина ICU Analysis, и подключить его как анализатор для автозаполнения?

Russ Cam 08.06.2018 11:33

Я сделал это, но проблема в том, что если человек начинает печатать со вторым словом вместо начала префикса, его не найти. Это одно из требований. Но если я нарежу слово и сделаю его списком предложений, тогда все в порядке :)

WickStargazer 08.06.2018 11:45

Похоже, что подсказка завершения может быть не лучшим подходом в этом случае, и что поиск по полю text может быть лучше. Если анализ вне подхода к индексации работает для вас, продолжайте :)

Russ Cam 08.06.2018 11:54

спасибо, так и думал. Не знаю, что окажется быстрее? Если у нас есть текущая работа по индексации ... будет ли автозаполнение быстрее? Еще раз спасибо! : D

WickStargazer 08.06.2018 12:26

Другие вопросы по теме