Удаление определенного первого элемента в строке в R

У меня есть такие строки, как:

'THE HOUSE'

'IN THE HOUSE'

'THE THE HOUSE'

И я хотел бы удалить «THE», только если он встречается в первой позиции в строке.

Я знаю, как удалить THE с помощью:

gsub("\\<THE\\>", "",  string)

И я знаю, как ухватить первое слово:

"([A-Za-z]+)" or "([[:alpha:]]+)"or "(\\w+)"

Но я не знаю, как объединить эти два, чтобы в итоге получить:

'HOUSE'

'IN THE HOUSE'

'THE HOUSE'

Ваше здоровье!

r regex gsub

02.09.2018 20:21

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать

string <- c("THE HOUSE", "IN THE HOUSE", "THE THE HOUSE")
sub("^THE\\b\\s*", "", string)
## => [1] "HOUSE"        "IN THE HOUSE" "THE HOUSE"

См. демонстрация регулярного выражения и онлайн демо R.

Подробности

^ - начало строки
THE - буквальная подстрока
\\b - граница слова (при желании вы можете оставить границу завершающего слова \\>)
\\s* - 0+ пробелов.

Спасибо, это именно то, что мне было нужно. Обожаю демки!

— 02.09.2018 20:30

02.09.2018 20:24