Как использовать регулярное выражение в C# для сопоставления китайских символов без сопоставления японской каны?

В C# \ p {Han} соответствует как китайским иероглифам, так и японским хирагане и катакане. Я хочу различать их, что мне делать? Превратите каждый символ в Unicode, а затем определите, находится ли символ в диапазоне?

Вы пробовали? Это сработало?

— 10.03.2018 04:13

У вас должна быть возможность исключить хирагану и катакану по их именам, docs.microsoft.com/en-us/dotnet/standard/base-types/…

— 10.03.2018 04:19

@RufusL, мое решение работает, но я хочу знать, есть ли другой способ, не такой грязный, как мой.

— 10.03.2018 04:23

c# .net uwp

10.03.2018 04:03

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

745

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

//For chinese chars
public bool IsChinese(string text)
{
    return text.Any(c => c >= 0x20000 && c <= 0xFA2D);
}

//For japanese chars
private static IEnumerable<char> GetCharsInRange(string text, int min, int max)
{
    return text.Where(e => e >= min && e <= max);
}

Применение:

var romaji = GetCharsInRange(searchKeyword, 0x0020, 0x007E);
var hiragana = GetCharsInRange(searchKeyword, 0x3040, 0x309F);
var katakana = GetCharsInRange(searchKeyword, 0x30A0, 0x30FF);
var kanji = GetCharsInRange(searchKeyword, 0x4E00, 0x9FBF);

0x20000 должен быть 0x2000? Я предполагаю, что это так, потому что c не может быть больше, чем 0x20000, а также меньше, чем 0xFA2D.

— 22.07.2020 01:20

10.03.2018 04:39