Замените строки, заключенные в кавычки, символами подчеркивания той же длины.

Я пишу скрипт python, в котором мне нужно заменить строки, окруженные кавычками, на символы подчеркивания, а количество символов подчеркивания должно быть равно длине строк. Вот что я пробовал:

>>> re.sub(r'"(.+?)"', (len(r"\1") * "_"), '"hellohello"')
'__'

Видимо, у меня там что-то не так. Ожидаемый результат для приведенного выше теста будет 10 символов подчеркивания, но я получил два. Есть идеи, где что-то пошло не так?

[РЕДАКТИРОВАТЬ] Я думаю, что r"\1" указывает на первое совпадение, потому что

>>> re.sub(r'"(.+?)"', r"\1"+ "pp", '"hellohello"')
'hellohellopp'
Анализ настроения постов в Twitter с помощью Python, Tweepy и Flair
Анализ настроения постов в Twitter с помощью Python, Tweepy и Flair
Анализ настроения текстовых сообщений может быть настолько сложным или простым, насколько вы его сделаете. Как и в любом ML-проекте, вы можете выбрать...
7 лайфхаков для начинающих Python-программистов
7 лайфхаков для начинающих Python-программистов
В этой статье мы расскажем о хитростях и советах по Python, которые должны быть известны разработчику Python.
Установка Apache Cassandra на Mac OS
Установка Apache Cassandra на Mac OS
Это краткое руководство по установке Apache Cassandra.
Сертификатная программа "Кванты Python": Бэктестер ансамблевых методов на основе ООП
Сертификатная программа "Кванты Python": Бэктестер ансамблевых методов на основе ООП
В одном из недавних постов я рассказал о том, как я использую навыки количественных исследований, которые я совершенствую в рамках программы TPQ...
Создание персонального файлового хранилища
Создание персонального файлового хранилища
Вы когда-нибудь хотели поделиться с кем-то файлом, но он содержал конфиденциальную информацию? Многие думают, что электронная почта безопасна, но это...
Создание приборной панели для анализа данных на GCP - часть I
Создание приборной панели для анализа данных на GCP - часть I
Недавно я столкнулся с интересной бизнес-задачей - визуализацией сбоев в цепочке поставок лекарств, которую могут просматривать врачи и...
1
0
24
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Здесь хорошо работает использование re.sub с функцией обратного вызова:

inp = '"hellohello"'
output = re.sub(r'"(.*?)"', lambda m: '"' + re.sub(r'.', '_', m.group(1)) + '"', inp)
print(output)  # "__________"

Хитрость здесь заключается в том, чтобы соответствовать "...", захватывая цитируемый контент в первой группе захвата. Затем мы заменяем каждый символ содержимого одним символом подчеркивания.

Это круто. Спасибо. При этом, почему мое решение неверно? Он пытается сделать то же самое.

zell 09.04.2022 07:37
len(r'\1') это не то, что вы думаете. Это длина необработанной строки \1, которая всегда будет равна 2. Здесь вам нужен обратный вызов или другой двухэтапный подход.
Tim Biegeleisen 09.04.2022 07:40

Другие вопросы по теме