Час получения регулярного выражения

У меня есть это REGEX, чтобы проверить абзац и получить оттуда некоторые данные.

([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2})[\s\D\s]+([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2}),(.+),(\s\w{1,2} de [\wç]+ de \d{4})?(\s\w+ \d{1,2}, \d{4})?$

Мне нужно получить час, название и дату этого типа текстов:

ПРИМЕР 1. В этом примере проблема возникает из-за числа 130, и я не могу получить первый час.

1:30pm to 4:30pm, Aniversário amigo matteo, Ana Montoya, Accepted, Location: Kids Buffet Infantil
Rua do Triunfo, 130, Brookling, Hello - SP, 04602-005, Brasil, November 23, 2022

ПРИМЕР 2: Это работает правильно

8am to 9:30am, All Hearts meeting, Ana Montoya, Accepted, Location: https://us02web.zoom.us/j/1234?pwd=1234, November 21, 2022

Получите два часа, текст заголовка и окончательную дату

В чем проблема? Я вижу 2 захваченных часа regex101.com/r/60w1uB/1

— 18.11.2022 21:05

К вашему сведению, {0,1} можно заменить на ?, что означает, что шаблон не является обязательным.

— 18.11.2022 21:12

Будет ли ваша строка всегда иметь один и тот же формат, и вы ищете только ответ регулярного выражения? Кроме того, как вы определяете, что такое заголовок?

— 18.11.2022 21:21

javascript regex

18.11.2022 21:02

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Улучшение производительности загрузки с помощью Google Tag Manager и атрибута Defer

В настоящее время производительность загрузки веб-сайта имеет решающее значение не только для удобства пользователей, но и для ранжирования в...

Безумие обратных вызовов в javascript [JS]

Здравствуйте! Юный падаван 🚀. Присоединяйся ко мне, чтобы разобраться в одной из самых запутанных концепций, когда вы начинаете изучать мир...

Система управления парковками с использованием HTML, CSS и JavaScript

Веб-сайт по управлению парковками был создан с использованием HTML, CSS и JavaScript. Это простой сайт, ничего вычурного. Основная цель -...

JavaScript Вопросы с множественным выбором и ответы

Если вы ищете платформу, которая предоставляет вам бесплатный тест JavaScript MCQ (Multiple Choice Questions With Answers) для оценки ваших знаний,...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Вы добавили $ в конце, это означает, что ваше выражение должно соответствовать концу строки ($ соответствует сразу после последнего символа в строке).

1- Проблема может быть решена довольно просто, убрав $ в конце:

([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2})[\s\D\s]+([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2}),(.+),(\s\w{1,2} de [\wç]+ de \d{4})?(\s\w+ \d{1,2}, \d{4})?

2- И лучше добавить символ ^ слева, чтобы заставить выражение соответствовать началу (символ ^ соответствует позиции перед первым символом в строке)

^([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2})[\s\D\s]+([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2}),(.+),(\s\w{1,2} de [\wç]+ de \d{4})?(\s\w+ \d{1,2}, \d{4})?

3- Или добавив .* в конце регулярного выражения (перед $),

([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2})[\s\D\s]+([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2}),(.+),(\s\w{1,2} de [\wç]+ de \d{4})?(\s\w+ \d{1,2}, \d{4})?.*$

На самом деле поиск по регулярному выражению соответствует максимуму. Добавив .* в конце (перед символом $), он будет соответствовать максимальному значению справа, поэтому, как и сдвиг влево, будет сопоставлено первое вхождение.

4- Или все эти решения:

^([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2})[\s\D\s]+([0-9]{1,2}:{0,1}[0-9]{0,2}[a-z]{0,2}),(.+),(\s\w{1,2} de [\wç]+ de \d{4})?(\s\w+ \d{1,2}, \d{4})?.*$

Кодовый ответ - это не качественно . Хотя этот код может быть полезен, вы можете улучшить его, объяснив, почему он работает, как он работает, когда его следует использовать и каковы его ограничения. Пожалуйста, отредактируйте свой ответ, включив в него объяснение и ссылку на соответствующую документацию.

— 18.11.2022 21:51

Это отчаянно нуждается в поддерживающем объяснении.

— 18.11.2022 22:55

Обновлено с объяснением

— 19.11.2022 01:58

18.11.2022 21:42

Ответ принят как подходящий

Вот модифицированное регулярное выражение с вашими примерами входных строк:

[
  '1:30pm to 4:30pm, Aniversário amigo matteo, Ana Montoya, Accepted, Location: Kids Buffet Infantil Rua do Triunfo, 130, Brookling, Hello - SP, 04602-005, Brasil, November 23, 2022',
  '8am to 9:30am, All Hearts meeting, Ana Montoya, Accepted, Location: https://us02web.zoom.us/j/1234?pwd=1234, November 21, 2022'
].forEach(str => {
  let m = str.match(/^(\d\d?(?::\d\d)?[ap]m) to (\d\d?(?::\d\d)?[ap]m), *([^,]+).* ([a-z]+ \d+, \d{4})/i);
  console.info(m);
});

Вывод:

[
  "1:30pm to 4:30pm, Aniversário amigo matteo, Ana Montoya, Accepted, Location: Kids Buffet Infantil Rua do Triunfo, 130, Brookling, Hello - SP, 04602-005, Brasil, November 23, 2022",
  "1:30pm",
  "4:30pm",
  "Aniversário amigo matteo",
  "November 23, 2022"
]
[
  "8am to 9:30am, All Hearts meeting, Ana Montoya, Accepted, Location: https://us02web.zoom.us/j/1234?pwd=1234, November 21, 2022",
  "8am",
  "9:30am",
  "All Hearts meeting",
  "November 21, 2022"
]

Объяснение регулярного выражения: