Аналогично этот вопрос я хочу захватить группу, которая повторяется более одного раза. Однако я не хочу использовать findall, потому что я использую порядок оценки регулярного выражения.
Моя проблема - Я хочу разобрать аргументы, которые выглядят так:
"(a, {b, c, d}, e)" # arguments are 1: "a", 2: "b, c, d", 3: "e"
"({a, b}, c, {d, e}, f)" # arguments are 1: "a, b", 2: c, 3: "d, e"
доб.
Аргументы разделяются запятыми, но контексты пары фигурных скобок — это один аргумент.
Это регулярное выражение, которое я пытался написать -
_SingleArg = "(?:(\{.+?\})|(.+?))"
ArgsParse = re.compile(f"(?:{_SingleArg}, )*{_SingleArg}?$")
Переменная _SingleArg пытается сопоставить полный аргумент в квадратных скобках, и если это не удается, она пытается сопоставить обычный аргумент.
Я не могу придумать способ сделать это с findall. Я могу сделать это, запустив несколько регулярных выражений: сначала найти аргументы в фигурных скобках, затем заменить их пустой строкой и, наконец, разделить запятой. Но это очень неэлегантное решение, тем более что я хочу знать и порядок аргументов.
Есть ли лучший способ сделать это с помощью регулярных выражений?
Спасибо,
Вы можете использовать этот шаблон и метод, чтобы сохранить порядок аргументов:
Выкройка: \w+|\{([\w, ]+)\}
Код:
pattern = r"\w+|\{([\w, ]+)\}"
test_string = "({a, b}, c, {d, e}, f)"
result = [(x, y.group().strip('{}')) for x, y in enumerate(re.finditer(pattern, test_string), start=1)]
print(result)
Выход:
[(1, 'a, b'), (2, 'c'), (3, 'd, e'), (4, 'f')]