Шаблон ANTLR "строка 1: 9 посторонний ввод" ожидает WORD "

Я только начинаю использовать ANTLR. Я пытаюсь написать парсер для определений полей, которые выглядят так:

field_name = value

Пример:

is_true_true = yes;

Моя грамматика выглядит так:


grammar Hello;

    //Lexer Rules
    
    fragment LOWERCASE  : [a-z] ;
    fragment UPPERCASE  : [A-Z] ;
    fragment DIGIT: '0'..'9';
    fragment TRUE: 'TRUE'|'true';
    fragment FALSE: 'FALSE'|'false';
    
    
    INTEGER : DIGIT+ ;
    STRING : ('\''.*?'\'') ;
    BOOLEAN : (TRUE|FALSE);
    
    
    WORD                : (LOWERCASE | UPPERCASE | '_')+ ;
    WHITESPACE          : (' ' | '\t')+ ;
    NEWLINE             : ('\r'? '\n' | '\r')+ ;
    
    field_def : WORD '=' WORD ';' ;
    

Но когда я запускаю сгенерированный синтаксический анализатор на «working = yes;» я получаю сообщение об ошибке:

line 1:7 extraneous input ' ' expecting '='

line 1:9 extraneous input ' ' expecting WORD


Я не совсем понимаю, есть ли ошибка в сопоставлении с шаблоном WORD или это что-то совсем другое?

Это определенно выглядит как API более высокого уровня, чем простые регулярные выражения, поэтому я удаляю тег.

Nissa 13.09.2018 16:23

похоже, вы не учитываете пробелы в поле def.

Daniel A. White 13.09.2018 16:27

@ DanielA.White Спасибо! Это была ошибка.

Jakob Sachs 13.09.2018 16:30
Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
3
406
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

В вашем примере есть пробелы, но ваш field_def не учитывает их.

Ответ принят как подходящий

Поскольку довольно часто пробелы не имеют значения для вашей грамматики (т.е. в нем нет семантического значения, кроме разделения слов), ANTLR позволяет просто пропустить его:

В ANTLR 4 это делается

WHITESPACE          : (' ' | '\t')+  -> skip;
NEWLINE             : ('\r'? '\n' | '\r')+ -> skip;

В ANTLR 3 синтаксис

WHITESPACE          : (' ' | '\t')+ { $channel = HIDDEN; };
NEWLINE             : ('\r'? '\n' | '\r')+ { $channel = HIDDEN; };

При этом лексический анализатор токенизует ввод как обычно, но синтаксический анализатор понимает, что эти токены для него не важны, и ведет себя так, как если бы их не было, позволяя вам сохранять свои правила простыми и без необходимости добавлять необязательные пробелы повсюду.

Другие вопросы по теме