Подпрограмма регулярного выражения игнорирует символ конца строки

Почему этот код Python печатает |ab|| вместо |ab|d\nefgh|? Я пытаюсь захватить оставшуюся часть строки после c (включая несколько строк), но я не знаю, что мне не хватает.

import re

s = re.sub(
    "^(.*){1}c(.*){2}$",
    "|\\1|\\2|",
    """abcd
    efgh""",
    flags=re.DOTALL,
    count=1
)
print(s)

Почему вы используете скобки {1} и {2} (которые обычно используются для явного указания количество повторов предшествующего им символа / группы, а не для нумерации групп захвата)? В этом случае они кажутся ненужными.

— 09.04.2021 07:19

Чтобы расширить это, я думаю, вы неправильно поняли эту конструкцию. Держу пари, ВЫ думали, что определяли эти две подфразы как №1 и №2, но это неправильно. {1} говорит: «Сделайте предыдущий токен 1 раз», а {2} говорит: «Сделайте предыдущий токен 2 раза».

— 09.04.2021 07:26

@TimRoberts Да, я так и думал. Теперь понятно, что мой код работал не так, как ожидалось.

— 09.04.2021 07:29

python python-3.x regex

09.04.2021 07:12

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Ответ принят как подходящий

Здесь нет необходимости в {1} и {2}. Просто удалите их, и все заработает так, как вы планировали.

^(.*)c(.*)

re.sub(
    "^(.*)c(.*)",
    "|\\1|\\2|",
    """abcd
    efgh""",
    flags=re.DOTALL,
)
'|ab|d\n    efgh|'

09.04.2021 07:21

Причина, по которой вы получаете этот вывод, заключается в том, что {2} повторяет группу захвата, давая вам значение последней итерации.

В первой итерации есть та часть, которую вы хотите, но, повторяя ее снова, значение группы будет пустым, поскольку .* может соответствовать 0+ символам.

Использование (.*)c будет соответствовать до последнего появления c. Если вы хотите найти совпадение до первого появления c, вы также можете использовать инвертированный класс символов.

Если вы используете нотацию необработанной строки r"\1", вам не нужна двойная обратная косая черта.

^([^c]*)c(.*)

Демо Regex

import re

s = re.sub(
    "^([^c]*)c(.*)",
    r"|\1|\2|",
    """abcd
    efgh""",
    flags=re.DOTALL,
    count=1
)
print(s)

Выход

|ab|d
    efgh|

09.04.2021 08:17

Другие вопросы по теме

Как назначить уникальную переменную в Python для каждой строки из вывода оболочки

Почему pd.read_csv ('file.csv') добавляет .999999 в конце некоторых значений?

При попытке def: Ошибка типа: неподдерживаемые типы операндов для ** или pow (): 'NoneType' и 'int'

Невозможно разрешить модуль imaplib2 без атрибута IMAP4_SSL

Python3 zip читает сжатый текстовый файл как строку байтов, но python2 izip читается как обычная строка

Я не могу вычислить определенный интеграл выражения, но продолжаю получать ошибку «ошибка полиномиального деления». Что я делаю неправильно?

Как мне понять эту функцию Python?

Flatten Json в Pyspark

Удаление ключей из фрейма данных

Поиск сравнений в сортировке слиянием

Подпрограмма регулярного выражения игнорирует символ конца строки

Ответы 2

Другие вопросы по теме

Похожие вопросы