Ошибка регулярного выражения Python: re.error: отсутствует: в позиции 40

При запуске следующего кода столкнулся с этой ошибкой:

re.error: отсутствует: в позиции 40

import re
re_keywords = ["Bitcoin", "Ethereum", "Tether", r"(?-i)BNB\s+Coin"]
re_keywords = [r"(" + kw + r")" for kw in re_keywords]
re_keywords = "|".join(re_keywords)
re_keywords = r"\b(?:" + re_keywords + r")\b"
print(re_keywords)
re_keywords = re.compile(re_keywords, re.I)

Я использую Python 3.8. Что случилось? Большое спасибо.

(?-i) не может быть встроенным
Freddy Mcloughlan 10.04.2022 03:29

Вам просто нужно re_keywords = ["Bitcoin", "Ethereum", "Tether", r"(?i:BNB\s+Coin)"], и нет необходимости помещать каждый в круглые скобки (если вы не используете его в re.split). pattern = re.compile(r"\b(?:{})\b".format("|".join(re_keywords)))

Wiktor Stribiżew 10.04.2022 17:00
Анализ настроения постов в Twitter с помощью Python, Tweepy и Flair
Анализ настроения постов в Twitter с помощью Python, Tweepy и Flair
Анализ настроения текстовых сообщений может быть настолько сложным или простым, насколько вы его сделаете. Как и в любом ML-проекте, вы можете выбрать...
7 лайфхаков для начинающих Python-программистов
7 лайфхаков для начинающих Python-программистов
В этой статье мы расскажем о хитростях и советах по Python, которые должны быть известны разработчику Python.
Установка Apache Cassandra на Mac OS
Установка Apache Cassandra на Mac OS
Это краткое руководство по установке Apache Cassandra.
Сертификатная программа "Кванты Python": Бэктестер ансамблевых методов на основе ООП
Сертификатная программа "Кванты Python": Бэктестер ансамблевых методов на основе ООП
В одном из недавних постов я рассказал о том, как я использую навыки количественных исследований, которые я совершенствую в рамках программы TPQ...
Создание персонального файлового хранилища
Создание персонального файлового хранилища
Вы когда-нибудь хотели поделиться с кем-то файлом, но он содержал конфиденциальную информацию? Многие думают, что электронная почта безопасна, но это...
Создание приборной панели для анализа данных на GCP - часть I
Создание приборной панели для анализа данных на GCP - часть I
Недавно я столкнулся с интересной бизнес-задачей - визуализацией сбоев в цепочке поставок лекарств, которую могут просматривать врачи и...
0
2
32
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Python не поддерживает ваш встроенный флаг таким образом. re требуется:

  • Флаг будет в начале
  • Флаг не является частью группового модификатора без захвата

See here

Допустимой формой будет:

(?i)\\b(?:(Bitcoin)|(Ethereum)|(Tether)|(BNB\\s+Coin))\\b

Но флаг меняется с (?-i) на (?i) и перемещается в начало

Спасибо. Я хочу, чтобы «BNB» был чувствителен к регистру, а остальные — без учета регистра. Вот почему я использовал (?-i). Есть ли способ добиться этого?

Victor Wang 10.04.2022 04:49

Да, просто используйте флаг без учета регистра re.I. Не могли бы вы привести несколько примеров соответствия и несоответствия, чтобы мы могли найти шаблон замены, пожалуйста?

Freddy Mcloughlan 10.04.2022 05:26

Я хочу, чтобы «монета BNB» соответствовала, а «монета bnb» — нет.

Victor Wang 10.04.2022 05:28

Я предлагаю вам создать новый вопрос, который больше сосредоточен на этой проблеме BNB и bnb (поскольку этот re.error изменился на вопрос о нечувствительности к регистру). Пожалуйста, добавьте несколько примеров строк, которые должны и не должны совпадать в этом новом вопросе. Спасибо Виктор

Freddy Mcloughlan 10.04.2022 05:49

Другие вопросы по теме