Регулярные выражения в строках юникода

У меня есть текст в Юникоде, который я хочу очистить с помощью регулярных выражений. Например, у меня есть случаи, когда u '(2'. Это существует потому, что по причинам форматирования закрывающая скобка заканчивается в соседней ячейке html. Мое первоначальное решение этой проблемы заключалось в том, чтобы смотреть вперед на содержимое следующей ячейки и использовать строку функция определяет, содержит ли он закрывающую скобку. Я знал, что это не лучшее решение, но оно сработало. Теперь я хочу исправить это, но не могу заставить регулярное выражение работать.

missingParen=re.compile(r"^\(\d[^\)]$")

Мое понимание того, что я думаю, что делаю:
^ в начале строки я хочу найти
(открытая скобка должна быть через обратную косую черту, потому что это специальный символ
\ d Я тоже хочу найти одну цифру
[Я создаю специальный класс символов
^ Я не хочу находить то, что следует за
), который является близким парнем
$ в конце строки

И, конечно, сюжет сгущается, я сделал глупое предположение, что, поскольку я поместил \ d, я не смог найти (33, но я ошибаюсь, поэтому я добавил {1} в свое регулярное выражение, и это не помогло, оно соответствует (3333, поэтому моя проблема сложнее, чем я думал. Я хочу, чтобы строка была только открытой пареной и одной цифрой. Это более умный подход

missingParen=re.compile(r"^\(\d$")

И обратите внимание на С. Лотта. Я уже пометил его как новичок, поэтому вы не можете получить никаких дешевых очков.

Актуальны ли ответы на мой вопрос Регулярное выражение и Юникод?

dbr 22.12.2008 04:25
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
1
1
469
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Хорошо, извините за использование этого стимулятора мышления потока сознания, но похоже, что запись моего первоначального вопроса поставила меня на путь. Мне кажется, что это решение того, что я пытаюсь сделать:

  missingParen=re.compile(r"^\(\d$")

Другие вопросы по теме