Создание схемы для пометки латинизмов (и т. д., т. е., например), но также пометки слов с этими буквами в них

У меня есть схематрон, созданный, чтобы помечать латинизмы в теме. Это работает слишком хорошо. Это также помечает слова, в которых есть эта комбинация букв. Например, ему нужно пометить «и т. д.», но он также помечает «kи т.дhup», потому что kи т.дhup имеет «и т. д.» в середине. Я не знаю, что изменить в моем коде, чтобы он помечал только фактическую латиницу, а не другие слова.

Вот мой код:

<sch:schema xmlns:sch = "http://purl.oclc.org/dsdl/schematron"
queryBinding = "xslt2">
   <sch:let name = "words" value = "' i.e, etc., e.g., vs, et al, circa'"/>
    <sch:let name = "wordsToMatch" value = "replace($words, ',', '|')"/>
    <sch:pattern id = "LatinismsCheck">
    <sch:rule context = "text()">
        <sch:report test = "matches(., $wordsToMatch)" role = "warn">
            The following words should not be added in the topic:
            <sch:value-of select = "$words"/>
           </sch:report>
        </sch:rule>
    </sch:pattern>
</sch:schema>

StackOverflow существует, чтобы помочь вам с проблемами кодирования. Это неподходящее место для вопросов об алгоритмах, дизайне приложений или обработке естественного языка. Если вы знаете, что вы хотите, чтобы ваша программа делала, можно спросить здесь. Если нет, то нужно спросить в другом месте.

Michael Kay 18.03.2022 17:25
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
1
1
16
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Может быть, вы можете отметить в регулярном выражении границу слова с помощью '\ b'. Что-то вроде этого:

<sch:schema xmlns:sch = "http://purl.oclc.org/dsdl/schematron"
queryBinding = "xslt2" xmlns:xsl = "http://www.w3.org/1999/XSL/Transform">
<sch:let name = "words" value = "'i.e.,etc.,e.g.'"/>
<sch:let name = "wordsToMatch">
    <xsl:for-each select = "tokenize($words,',')">
        <xsl:value-of select = "concat('(\b', normalize-space(.), ')')"/>
        <xsl:if test = "position() != last()">
            <xsl:value-of select = "'|'"/>
        </xsl:if>
    </xsl:for-each>
</sch:let>

<sch:pattern>
    <sch:rule context = "text()">
        <sch:report test = "matches(., string($wordsToMatch), ';j')" role = "warn">
            The following words should not be added in the topic: <sch:value-of select = "$words"/>
        </sch:report>
    </sch:rule>
</sch:pattern></sch:schema>

Другие вопросы по теме