У меня есть текст в Юникоде, который я хочу очистить с помощью регулярных выражений. Например, у меня есть случаи, когда u '(2'. Это существует потому, что по причинам форматирования закрывающая скобка заканчивается в соседней ячейке html. Мое первоначальное решение этой проблемы заключалось в том, чтобы смотреть вперед на содержимое следующей ячейки и использовать строку функция определяет, содержит ли он закрывающую скобку. Я знал, что это не лучшее решение, но оно сработало. Теперь я хочу исправить это, но не могу заставить регулярное выражение работать.
missingParen=re.compile(r"^\(\d[^\)]$")
Мое понимание того, что я думаю, что делаю:
^ в начале строки я хочу найти
(открытая скобка должна быть через обратную косую черту, потому что это специальный символ
\ d Я тоже хочу найти одну цифру
[Я создаю специальный класс символов
^ Я не хочу находить то, что следует за
), который является близким парнем
$ в конце строки
И, конечно, сюжет сгущается, я сделал глупое предположение, что, поскольку я поместил \ d, я не смог найти (33, но я ошибаюсь, поэтому я добавил {1} в свое регулярное выражение, и это не помогло, оно соответствует (3333, поэтому моя проблема сложнее, чем я думал. Я хочу, чтобы строка была только открытой пареной и одной цифрой. Это более умный подход
missingParen=re.compile(r"^\(\d$")
И обратите внимание на С. Лотта. Я уже пометил его как новичок, поэтому вы не можете получить никаких дешевых очков.






Хорошо, извините за использование этого стимулятора мышления потока сознания, но похоже, что запись моего первоначального вопроса поставила меня на путь. Мне кажется, что это решение того, что я пытаюсь сделать:
missingParen=re.compile(r"^\(\d$")
Актуальны ли ответы на мой вопрос Регулярное выражение и Юникод?