Динамическое регулярное выражение для форматов даты и времени

Есть ли существующее решение для динамического создания регулярных выражений из заданного шаблона формата даты и времени? Поддерживаемый шаблон формата даты и времени не имеет значения (Joda DateTimeFormat, java.text.SimpleDateTimeFormat или другие).

В качестве конкретного примера, для заданного формата даты и времени, такого как dd/MM/yyyy hh:mm, он должен сгенерировать соответствующее регулярное выражение, чтобы соответствовать дате и времени в указанных форматах.

regex datetime information-retrieval

09.09.2008 18:50

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

5 936

Перейти к ответу Данный вопрос помечен как решенный

Ответы 4

SimpleDateFormat уже делает это с помощью метода parse().

Если вам нужно проанализировать несколько дат из одной строки, начните с регулярного выражения (даже если оно слишком мягко совпадает) и используйте parse() для всех потенциальных совпадений, найденных регулярным выражением.

он анализирует, только если данный текст соответствует шаблону, и возвращает объектное представление Date этой строки. Он не анализирует, находится ли информация о дате где-то в других текстах. вроде "sometext 12/03/2004 sometext.

— 09.09.2008 19:33

Это может быть неразрешимым. Что делать, если в тексте есть две даты, например «Между A и B, мля», где A и B - даты ...

— 09.09.2008 20:12

Что ж, тогда они будут найдены как две группы, как и при поиске регулярного выражения.

— 11.09.2008 11:44

09.09.2008 19:24

Если вы ищете базовую проверку даты, этот код соответствует этим данным.

\b(0?[1-9]|[12][0-9]|3[01])[- /.](0?[1-9]|1[012])[- /.](19|20)?[0-9]{2}\b

10/07/2008  
10.07.2008
1-01/2008
10/07/08    
10.07.2008
1-01/08

Код через регулярное выражение

мне нужен генератор регулярных выражений для данного DateTimeFormat. Я не знаю формат даты, используемый в данном корпусе. Итак, пользователь сначала должен предоставить, сказав sth, например DDMM hh: mm, и я нахожу эти значения даты в тексте. Я создал что-то с помощью JFlex. Я также выложу это здесь после того, как почищу.

— 08.10.2008 12:12

07.10.2008 19:28

Ответ принят как подходящий

Я предполагаю, что у вас есть ограниченный алфавит, из которого могут быть построены ваши форматы времени. Это означает, что "HH" всегда будет «часами» в 24-часовом формате, "dd" всегда будет днем с нулем в начале и так далее.

Из-за последовательной природы формата времени вы можете попытаться токенизировать строку формата "dd/mm/yyyy HH:nn" в массив ["dd", "/", "mm", "/", "yyyy", " ", "HH", ":", "nn"]. Затем сформируйте строку шаблона из этого массива, заменив "HH" на "([01][0-9]|2[0-3])" и так далее. Предварительно сконструируйте эти атомы шаблона в поисковую таблицу / массив. Все части вашего массива, которых нет в таблице поиска, являются литералами. Избегайте их в соответствии с правилами регулярных выражений и добавьте их в строку шаблона.

Обновлено: в качестве побочного эффекта для решения на основе регулярных выражений, когда вы помещаете все «атомы» регулярных выражений в свою таблицу поиска в скобки и отслеживаете их порядок в заданной строке формата, вы сможете использовать вспомогательные совпадения для извлечения необходимые компоненты из совпадения и передать их в функцию CreateDate, таким образом полностью пропуская часть ParseDate.

Это прилично работает, но в большей степени ориентировано на английский язык. Тогда "ddd" может быть сопоставлено с (пн | вт | ср | чт | пт | сб | вс), но вам потребуется отображение, зависящее от локали. Становится хуже, когда формат даты генерирует цифры, отличные от ASCII. Более подробную информацию об i18n можно найти в блоге М.Каплана.

— 08.10.2008 12:57

Да, это именно то, что мне нужно. Я подумал сделать что-то подобное, так как не смог найти ничего, что уже существует. Для разбора dateTimeFormat я использовал jflex. Таким образом, если это "d", оно должно соответствовать 1 или 2 цифрам, или если это "ddd", оно должно соответствовать 3 цифрам и т. д. Однако мне все еще нужно улучшить его для i18n.

— 08.10.2008 14:26

@MSalters. Не могли бы вы дать ссылку на упомянутый вами блог? Спасибо

— 08.10.2008 14:27

Для шаблонов, зависящих от языкового стандарта, вы можете абстрагироваться от этого и построить таблицу поиска из функций даты локали вашего языка. Предварительное знание языка, на котором проводятся свидания, конечно, требуется, но тогда это довольно просто.

— 08.10.2008 15:04

Имейте в виду, что «дд» для «2 цифр» приведет к ложным срабатываниям. «99» будет соответствовать, но, конечно же, недопустимо в качестве компонента даты, кроме «двузначного года».

— 08.10.2008 15:12

Да, это очевидно, мне просто не хватило символов, чтобы объяснить более подробно при добавлении комментария. Реальная нагрузка заключается в том, как MSalters сказал, что цифры, отличные от ASCII, такие как японские и арабские числа. Я думаю, что для каждого типа наборов цифр следует создавать разные регулярные выражения.

— 08.10.2008 15:30

Конечно. Как я уже сказал, я думаю, что вы можете извлечь большинство из них из функций даты, специфичных для локали, на выбранном вами языке программирования, и некоторые из них могут потребовать ручной работы, если вы знаете, что делаете. I18N - это сложно, если брать на максимум.

— 08.10.2008 15:54

08.10.2008 12:49

Приведенный ниже код js / jQuery предназначен для динамически сгенерированного RegEx только для формата даты, а не для DateTime (версия для разработки еще не полностью протестирована).

Формат даты должен быть в "Д М Г".

Например.

DD-MM-YY
DD-MM-YYYY
YYYY-MM-DD
YYYY-DD-MM
MM-DD-YYYY
MM-DD-YY
DD/MM/YY
DD/MM/YYYY
YYYY/MM/DD
YYYY/DD/MM
MM/DD/YYYY
MM/DD/YY

Или другие форматы, но созданные с использованием символов «Д М Г»:

var dateFormat = "DD-MM-YYYY";
var order = [];
    var position = {"D":dateFormat.search('D'),"M":dateFormat.search('M'),"Y":dateFormat.search('Y')};
    var count = {"D":dateFormat.split("D").length - 1,"M":dateFormat.split("M").length - 1,"Y":dateFormat.split("Y").length - 1};
    var seprator ='';
    for(var i=0; i<dateFormat.length; i++){
  if (["Y","M","D"].indexOf(dateFormat.charAt(i))<0){
    seprator = dateFormat.charAt(i);
  }else{
    if (order.indexOf(dateFormat.charAt(i)) <0 ){
        order.push(dateFormat.charAt(i));
    }
  }
    }
    var regEx  = "^";
    $(order).each(function(ok,ov){
    regEx  += '(\d{'+count[ov]+'})'+seprator;
    });
    regEx = regEx.substr(0,(regEx.length)-1);
  regEx  + = "$";
  var re = new RegExp(regEx);
  console.info(re);

ПРИМЕЧАНИЕ. Проверки по месяцам / дням не проводятся. например месяц должен быть в 01-12 или дата должна быть в 01-31

28.12.2016 16:42