Регулярные выражения в строках юникода

У меня есть текст в Юникоде, который я хочу очистить с помощью регулярных выражений. Например, у меня есть случаи, когда u '(2'. Это существует потому, что по причинам форматирования закрывающая скобка заканчивается в соседней ячейке html. Мое первоначальное решение этой проблемы заключалось в том, чтобы смотреть вперед на содержимое следующей ячейки и использовать строку функция определяет, содержит ли он закрывающую скобку. Я знал, что это не лучшее решение, но оно сработало. Теперь я хочу исправить это, но не могу заставить регулярное выражение работать.

missingParen=re.compile(r"^\(\d[^\)]$")

Мое понимание того, что я думаю, что делаю:
^ в начале строки я хочу найти
(открытая скобка должна быть через обратную косую черту, потому что это специальный символ
\ d Я тоже хочу найти одну цифру
[Я создаю специальный класс символов
^ Я не хочу находить то, что следует за
), который является близким парнем
$ в конце строки

И, конечно, сюжет сгущается, я сделал глупое предположение, что, поскольку я поместил \ d, я не смог найти (33, но я ошибаюсь, поэтому я добавил {1} в свое регулярное выражение, и это не помогло, оно соответствует (3333, поэтому моя проблема сложнее, чем я думал. Я хочу, чтобы строка была только открытой пареной и одной цифрой. Это более умный подход

missingParen=re.compile(r"^\(\d$")

И обратите внимание на С. Лотта. Я уже пометил его как новичок, поэтому вы не можете получить никаких дешевых очков.

Актуальны ли ответы на мой вопрос Регулярное выражение и Юникод?

— 22.12.2008 04:25

python regex

11.12.2008 22:37

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

469

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Хорошо, извините за использование этого стимулятора мышления потока сознания, но похоже, что запись моего первоначального вопроса поставила меня на путь. Мне кажется, что это решение того, что я пытаюсь сделать: