Как я могу игнорировать акценты при сравнении строк в Perl?

У меня есть это приложение-викторина, в котором я подбираю правильный ответ по тому, что люди набирают. На данный момент я в основном вот что:

if ($input =~ /$answer/i) {
     print "you won";
}

Приятно, что если ответ - «рыба», пользователь может набрать «рыба» и будет считаться хорошим ответом.

Проблема, с которой я столкнулся, заключается в том, что мои пользователи, поскольку я француз, и я хотел бы иметь возможность принимать, скажем, пользователя, вводящего «taton», а ответ - «tâton».

Итак, что я мог сделать, это:

use POSIX qw(locale_h);
use locale;
setlocale(LC_TYPE, "fr_FR.ISO8859-15");
setlocale(LC_COLLATE, "fr_FR.ISO8859-15");

И в моей программе проверки сделайте следующее:

$input = lc($input);
$input =~ tr/àáâãäåçèéêëìíîïñòóôõöùúûüýÿ/aaaaaaceeeeiiiinooooouuuuyy/;

и что-то подобное с ответом.

Мне это не нравится, потому что мне приходится жестко кодировать вещи, и в тот день, когда я решу, что ухожу из мира ISO-8859-15 в мир UTF-8, я обречен.

Итак, я ищу способ сравнить строки, который сделает "tâton" eq "taton", "maçon" eq "macon" или "macon" =~ /maçon/ верными.

Обратной стороной является то, что пользователь мог набрать: «эгоистичные гномы», и они все равно были бы правы.

— 22.12.2008 19:28

Это был просто пример, и, ну, они также могли каждый раз набирать весь словарь :-)

— 22.12.2008 19:36

Вы, вероятно, захотите, чтобы там были какие-то границы слов: m / \ b $ answer \ b /

— 22.12.2008 21:46

perl string comparison diacritics

22.12.2008 18:06

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

2 221

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Попробуйте модуль Текст :: Без акцента от CPAN (или Текст :: Unaccent :: PurePerl).

22.12.2008 19:05

Это не похоже на подходящий повод для вызова регулярных выражений - у вас должен быть просто список приемлемых ответов, плюс некоторая фильтрация для удаления несущественных слов, таких как «a», «the» и их языковых эквивалентов.

Что бы вы ни делали, мне кажется очевидным, что это должно быть с учетом кодировки символов и языков. Регулярные выражения обычно не являются ни тем, ни другим.

28.01.2009 07:24

Другие вопросы по теме

Нужна помощь - преобразование битового поля

Приведение типов в Python

Изменение строк в Objective-C с помощью NSAttributedString

Лучший способ вернуть язык данной строки

Замена символов с диакритическими знаками / umlauted на их неукрашенные аналоги в C#

Пожалуйста, объясните это регулярное выражение Perl

(C++) Нужна помощь с базой данных

Копировать строку в указатель на указатель

C# Именованные параметры в строку, которая заменяет значения параметров

Форматировать как дробь

Как я могу игнорировать акценты при сравнении строк в Perl?

Ответы 2

Другие вопросы по теме

Похожие вопросы