Регулярное выражение JavaScript для получения первого алфавита из максимум 3 слов персидской / английской строки

Регулярное выражение JavaScript для получения первого алфавита из максимум 3 слов персидской / английской строкиI содержат следующие строки на персидском и английском языках.

1- روه جوانان خلاق

2- (نی (حمایت کننده رسانه های آزاد افغانستان

3- نی | حمایت ننده رسانه های آزاد افغانستان

4- NKCC (Строительная компания Нави Кундуз)

5- Услуги по развитию и регистрации в Афганистане

Я хочу получить первый алфавит из максимум 3 слов в каждом предложении. Что я пробовал:

\b(?:(?:[a-zA-Z0-9])|(?:[\u0621-\u0628\u062A-\u063A\u0641-\u0642\u0644-\u0648\u064E-\u0651\u0655\u067E\u0686\u0698\u06A9\u06AF\u06BE\u06CC]))

Выше регулярное выражение работает только для английского предложения, моя основная проблема связана с \b для персидского предложения и заставляет рассматривать только максимум 3 слова.

Что-то вроде regex101.com/r/uzIRZa/1 (обратите внимание, что выделение арабского языка там не работает, просто посмотрите на панель MATCH справа)

Wiktor Stribiżew 02.05.2018 12:12

Также см. jsfiddle.net/74ufn709

Wiktor Stribiżew 02.05.2018 12:19

@ WiktorStribiżew возвращает ), но мне нужен только алфавит

jones 02.05.2018 12:19

Нет, не "возвращает" ). Вам нужно только значение группы 1. См. jsfiddle.net/74ufn709

Wiktor Stribiżew 02.05.2018 12:20

Итак, работает ли демонстрация кода для вас, или, пожалуйста, сообщите, что там не так.

Wiktor Stribiżew 02.05.2018 13:14

@ WiktorStribiżew Итак, как мы можем сопоставить не более 3 слов?

jones 02.05.2018 13:20

@ WiktorStribiżew для меня ваша проблема с регулярным выражением связана с границей слова, например, если слово не содержит символов алфавита, таких как adfds-ds-dfs, оно принимает его как 3 слова, а также для тех слов, которые похожи на NKCC (Nawi Kunduz Construction Company), он возвращает ['N', '(N', 'K', 'K', 'C', 'C']

jones 02.05.2018 13:27

Что вы подразумеваете под «максимум 3 слова»? В моем фрагменте ( не возвращается вместе с N. Я не знаю, какой код вы используете.

Wiktor Stribiżew 02.05.2018 13:29

@ WiktorStribiżew Моя цель - если в предложении больше трех слов, то получится первый алфавит из первых трех слов.

jones 02.05.2018 13:33

А если всего 1, 2 или 3 слова? Ничего не вернуть?

Wiktor Stribiżew 02.05.2018 13:35

@ WiktorStribiżew Нет, менее 3 слов он должен возвращать первый алфавит всех слов, теперь проверьте мой вопрос, я приложил ваш ответ

jones 02.05.2018 13:52

Вы приложили скриншот теста regex101, выглядит некрасиво. В любом случае, как я уже сказал, Группа 1 - это все, что вам нужно. И чтобы получить первые 3, вы можете просто нарезать получившийся массив. Или ограничьте его популяцию при создании. См. this demo

Wiktor Stribiżew 02.05.2018 13:58

@ WiktorStribiżew Спасибо, все работает.

jones 03.05.2018 06:11
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer
В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...
Безумие обратных вызовов в javascript [JS]
Безумие обратных вызовов в javascript [JS]
Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...
Система управления парковками с использованием HTML, CSS и JavaScript
Система управления парковками с использованием HTML, CSS и JavaScript
Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...
JavaScript Вопросы с множественным выбором и ответы
JavaScript Вопросы с множественным выбором и ответы
Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...
1
13
67
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете создать регулярное выражение, которое сначала соответствует началу строки или любому символу, кроме слова (букв и цифр) char, а затем захватывает первую букву / цифру, но собирает только первые 3 совпадения:

var strs = ["|گروه جوانان خلاق", "(نی (حمایت کننده رسانه های آزاد افغانستان", "نی | حمایت کننده رسانه های آزاد افغانستان", "NKCC (Nawi Kunduz Construction Company)","5- Afghanistan Development And Registry Services"];
var pblock = "\\u0621-\\u0628\\u062A-\\u063A\\u0641-\\u0642\\u0644-\\u0648\\u064E-\\u0651\\u0655\\u067E\\u0686\\u0698\\u06A9\\u06AF\\u06BE\\u06CC";
var rx = new RegExp("(?:^|[^a-zA-Z0-9" + pblock + "])([a-zA-Z0-9" + pblock + "])", "g");
for (var s of strs) {
  var m, cnt=0, res=[];
  while (m=rx.exec(s)) {
    if (cnt < 3) {
  		res.push(m[1]);
      cnt++;
    } else break;
  }
  console.info(s, res);
  
}

Другие вопросы по теме