AWT TextArea, кажется, считает последовательность cr-lf как один символ

У меня такая проблема:

Текст «ABCD \ r \ nEFGHJ», загруженный из файла, сопоставляется с регулярным выражением Java «EFGH». Объект сопоставления, конечно, говорит, что начало сопоставленной строки находится в позиции 6. Сопоставитель считает \ r \ n как две позиции.

Я помещаю исходный текст в компонент AWT TextArea, а затем вызываю select (6,10), чтобы выделить совпавшую область. Угадайте, что ... он начинает выделяться с буквы «F». На одну позицию вперед, чем следовало ...

Если перед совпадающей областью предшествует более 1 пары crlf, то выделение перемещается еще дальше, чем должно.

У кого-нибудь есть простое решение?

Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами
В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Поднятие тревоги для долго выполняющихся методов в Spring Boot
Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...
Полный курс Java для разработчиков веб-сайтов и приложений
Полный курс Java для разработчиков веб-сайтов и приложений
Получите сертификат Java Web и Application Developer, используя наш курс.
0
0
641
3

Ответы 3

Простое решение: удалить все \ r из текста ... :-P

Не так глупо, как кажется, если только у вас не совпадают концы строк (это может случиться) и вы не хотите, чтобы они оставались неизменными ... И это, вероятно, то, что компонент делает в любом случае.

Событие ColdFusion имеет для этого встроенную функцию. Безопасная ставка.

Tomalak 24.10.2008 16:01

Я не могу связываться с текстом, потому что это данные протокола, а символы \ r и \ n имеют семантику, которая не имеет отношения к отображению или разделению строк. Мне просто нужен компонент, который будет обрабатывать каждый входной символ отдельно и рассматривать его как отображаемый и подсчитанный, независимо от того, как он отображается.

Если \ r \ n согласованы, вы можете удалить \ r перед запуском регулярного выражения, а затем заменить их, прежде чем переходить к следующему. Или замените копию, если так лучше. Таким образом, ваше регулярное выражение находит позицию в соответствии с тем, что ожидает AWT.

Другие вопросы по теме