Представьте себе небольшую PEG грамматику, например
from parsimonious.grammar import Grammar
from parsimonious.nodes import NodeVisitor
grammar = Grammar(
r"""
term = lpar (number comma? ws?)+ rpar
number = ~"\d+"
lpar = "("
rpar = ")"
comma = ","
ws = ~"\s*"
"""
)
tree = grammar.parse("(5, 4, 3)")
print(tree)
Какие выходы
<Node called "term" matching "(5, 4, 3)">
<Node called "lpar" matching "(">
<Node matching "5, 4, 3">
<Node matching "5, ">
<RegexNode called "number" matching "5">
<Node matching ",">
<Node called "comma" matching ",">
<Node matching " ">
<RegexNode called "ws" matching " ">
<Node matching "4, ">
<RegexNode called "number" matching "4">
<Node matching ",">
<Node called "comma" matching ",">
<Node matching " ">
<RegexNode called "ws" matching " ">
<Node matching "3">
<RegexNode called "number" matching "3">
<Node matching "">
<Node matching "">
<RegexNode called "ws" matching "">
<Node called "rpar" matching ")">
Как получить часть регулярного выражения number из term в этом примере? Я знаю, что мог бы использовать класс NodeVisitor и проверять каждое число, но я хотел бы получить часть регулярного выражения изнутри term.






Вероятно, лучше использовать класс NodeVisitor и ходить по дереву таким образом, но вот еще одно простое решение:
from parsimonious.grammar import Grammar
from parsimonious.nodes import NodeVisitor
grammar = Grammar(
r"""
term = lpar (number comma? ws?)+ rpar
number = ~"\d+"
lpar = "("
rpar = ")"
comma = ","
ws = ~"\s*"
"""
)
tree = grammar.parse("(5, 4, 3)")
def walk(node):
if node.expr_name == 'number':
print(node)
for child in node.children:
walk(child)
walk(tree)
# <RegexNode called "number" matching "5">
# <RegexNode called "number" matching "4">
# <RegexNode called "number" matching "3">
Большое спасибо, я сейчас использую комбинацию.