Извлечь заглавные слова до первой строчной буквы

Мне нужно извлечь первую часть текста, которая находится в верхнем регистре до первой строчной буквы.

Например, у меня есть текст: "IV ДЛИННЫЙ ТЕКСТ ЗДЕСЬ и теперь текст заканчивается ЗДЕСЬ"

Я хочу извлечь «IV ДЛИННЫЙ ТЕКСТ ЗДЕСЬ».

Я пробовал что-то вроде этого:

text <- "IV LONG TEXT HERE and now the Text End HERE"

stringr::str_extract_all(text, "[A-Z]")

но я терплю неудачу в регулярном выражении.

Вам может понадобиться stringr::str_replace(text, "([A-Z ]+)\\s+.*", "\\1")

akrun 17.05.2022 22:26
Формы c голосовым вводом в React с помощью Speechly
Формы c голосовым вводом в React с помощью Speechly
Пытались ли вы когда-нибудь заполнить веб-форму в области электронной коммерции, которая требует много кликов и выбора? Вас попросят заполнить дату,...
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Стилизация и валидация html-формы без использования JavaScript (только HTML/CSS)
Будучи разработчиком веб-приложений, легко впасть в заблуждение, считая, что приложение без JavaScript не имеет права на жизнь. Нам становится удобно...
Flatpickr: простой модуль календаря для вашего приложения на React
Flatpickr: простой модуль календаря для вашего приложения на React
Если вы ищете пакет для быстрой интеграции календаря с выбором даты в ваше приложения, то библиотека Flatpickr отлично справится с этой задачей....
В чем разница между Promise и Observable?
В чем разница между Promise и Observable?
Разберитесь в этом вопросе, и вы значительно повысите уровень своей компетенции.
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Что такое cURL в PHP? Встроенные функции и пример GET запроса
Клиент для URL-адресов, cURL, позволяет взаимодействовать с множеством различных серверов по множеству различных протоколов с синтаксисом URL.
Четыре эффективных способа центрирования блочных элементов в CSS
Четыре эффективных способа центрирования блочных элементов в CSS
У каждого из нас бывали случаи, когда нам нужно отцентрировать блочный элемент, но мы не знаем, как это сделать. Даже если мы реализуем какой-то...
0
1
26
3
Перейти к ответу Данный вопрос помечен как решенный

Ответы 3

Вместо str_extract используйте str_replace или str_remove

library(stringr)
# match one or more space (\\s+) followed by
# one or more lower case letters ([a-z]+) and rest of the characters (.*)
# to remove those matched characters
str_remove(text, "\\s+[a-z]+.*")
[1] "IV LONG TEXT HERE"
# or match one or more upper case letters including spaces ([A-Z ]+)
# capture as group `()` followed one or more space (\\s+) and rest of
#characters (.*), replace with the backreference (\\1) of captured group
str_replace(text, "([A-Z ]+)\\s+.*", "\\1")
[1] "IV LONG TEXT HERE"
Ответ принят как подходящий

Вы можете использовать str_extract с шаблоном для соответствия одному символу в верхнем регистре и, возможно, для соответствия пробелам и символам в верхнем регистре, заканчивающимся другим символом в верхнем регистре.

\b[A-Z](?:[A-Z ]*[A-Z])?\b

Объяснение

  • \b[A-Z] Граница слова для предотвращения частичного совпадения слов, а затем сопоставление одного символа от A до Z.
  • (?: Группа без захвата соответствует целому
    • [A-Z ]*[A-Z] Сопоставьте необязательные символы A-Z или пробел и сопоставьте символ A-Z
  • )? Закройте группу без захвата и сделайте ее необязательной
  • \b Граница слова

Пример

text <- "IV LONG TEXT HERE and now the Text End HERE"

stringr::str_extract(text, "\\b[A-Z](?:[A-Z ]*[A-Z])?\\b")

Выход

[1] "IV LONG TEXT HERE"

Приведенный ниже пример кода должен работать.

text <- "IV LONG TEXT HERE and now the Text End HERE"

stringr::str_extract_all(text, "\\w.*[A-Z] \\b")

Выход :

[1] 'IV LONG TEXT HERE '

Интерпретация:

Возвращает любой символ слова (\ ш), который появляется ноль или более раз (.*), удовлетворяет диапазону ([А-Я]) в верхнем регистре и заканчивается пробелом (\б).

Другие вопросы по теме