Регулярное выражение grep для соответствия пробелу и/или TAB и классу '[:space:]'

В CentOS 8 это выражение grep не возвращает совпадающие строки:

% dmidecode -t memory | grep -E '^[ \t]+Size: [0-9]+'

Однако этот правильно возвращает совпадающие строки (в том же дистрибутиве):

% dmidecode -t memory | grep -E '^[[:space:]]+Size: [0-9]+'

В чем причина такого поведения? Как видите, оба раза grep вызывается в режиме расширенного регулярного выражения.

В grep '^[ \t]+Size: [0-9]+' шаблон анализируется как POSIX BRE. Передайте флаг -E, чтобы сделать его POSIX ERE, если вы хотите, чтобы + анализировался как квантификатор.

Wiktor Stribiżew 17.12.2020 20:26

Вам не хватает -E в первой команде grep

anubhava 17.12.2020 20:26

При публикации вопроса я пропустил «-E» в первой команде, он должен быть там, но grep не возвращает совпадающие строки.

Mark 17.12.2020 20:41

Тогда вам нужно grep -E '^[[:blank:]]+Size: [0-9]+' или grep -E '^[[:blank:]]+Size:[[:blank:]]+[0-9]+'. Обратите внимание, что [ \t] как шаблон регулярного выражения фактически эквивалентен классу символов [:blank:] POSIX, а не [:space:] (он также включает вертикальные пробелы).

Wiktor Stribiżew 17.12.2020 21:10

В общем, ваша проблема, скорее всего, связана с тем, как Cent OS обрабатывает строки с одинарными кавычками при передаче их в grep, а не с шаблоном регулярного выражения, который работает иначе.

Wiktor Stribiżew 17.12.2020 21:16

@WiktorStribiżew Нет, это регулярное выражение. Первый просто не работает так, как думает OP.

Shawn 18.12.2020 00:33

Отвечает ли это на ваш вопрос? Какой пробел в grep является лучшим стандартом?

Ryszard Czech 18.12.2020 01:25

Отвечает ли это на ваш вопрос? grep вкладку в UNIX

Tsyvarev 20.12.2020 11:30
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
1
8
1 252
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Используйте [[:blank:]], который соответствует символу пробела и символу табуляции. Вы также можете опустить -E:

grep '^[[:blank:]]+ Size: [0-9]+'

Ваше решение не работает. Решение OP работает с опцией -E. В POSIX BRE + соответствует символу плюс.

Wiktor Stribiżew 17.12.2020 21:08

Должен быть ^[[:blank:]]\{1,\} Size: [0-9]\{1,\} для того же эффекта в BRE.

Shawn 18.12.2020 00:07
Ответ принят как подходящий

Проблема здесь в последовательности символов \t. Это не соответствует символу табуляции в регулярном выражении grep, оно соответствует символу t (не имеет значения, является ли это базовым или расширенным диалектом RE). Это не рассматривается как специальная escape-последовательность, как в некоторых других инструментах (включая GNU grep с использованием диалекта PCRE).

Свидетель:

# printf /does/ treat \t and \n special in a format
$ printf "a\tb\n" | grep "a[ \t]b" # No match
$ printf  "atb\n" | grep "a[ \t]b" # Match
atb
$ printf "a\tb\n" | grep "a[[:space:]]b" # Match
a     b
$ printf "a\tb\n" | grep "a[[:blank:]]b" # Match
a     b
$ printf "a\tb\n" | grep "a\sb" # Match, \s is a GNU grep extension
a     b
$ printf "a\tb\n" | grep -P "a\sb" # Match, GNU grep using PCRE
a     b
$ printf "a\tb\n" | grep -P "a[ \t]b" # Match, GNU grep using PCRE.
a     b

Другие вопросы по теме