Захватите только "\n", если он находится внутри круглых скобок

Я выполняю некоторую обработку текста для анализа, но столкнулся с проблемой, когда мне нужно удалить только «\n» (непосредственно за которым следует слово) в круглых скобках. Я думаю, что пример может прояснить, что я хочу сделать:

“\nMr. Johnson (spoke in \nRussian) (United Kingdom and \nNortheren Ireland) \n”

Мне нужен «\n» перед г-ном Джонсоном для другой задачи, и поэтому меня интересует только удаление \n, если оно находится внутри круглых скобок, и сохранение остального текста, чтобы получить следующий вывод:

“\nMr. Johnson (spoke in Russian) (United Kingdom and Northeren Ireland) \n”

Моя основная идея состоит в том, чтобы сделать какое-то регулярное выражение, которое может захватывать «\n» внутри круглых скобок и вместе с функцией str_replace_all() из пакета stringr удалять его. Тем не менее, я обнаружил, что это легче сказать, чем сделать, и после некоторых исследований и времени я придумал два возможных способа, которые в любом случае могут быть решением этой проблемы:

Я придумал следующий шаблон регулярного выражения «(говорит в (\n).*?)». Но он выбирает все слова внутри круглых скобок, и, кроме того, он не может выбирать случаи, когда \n не появляется после «говорил»…
Создайте шаблон условного регулярного выражения: используйте следующие источники для вдохновения https://thewikihow.com/video_k4Be42-sf0s , https://www.regular-expressions.info/conditional.html и Регулярное выражение с условием if Я попытался создать следующий шаблон: "(?(?=((.*?)))\n)", но, похоже, он не работает...

Поэтому я буду здесь, если кто-нибудь из вас, поклонников регулярных выражений, может помочь мне решить эту проблему? Я использую R и, следовательно, использую механизм регулярных выражений ICU.

Всего наилучшего Эрик

Привет Виктор! Буду очень благодарна за развернутый ответ!!! Всего наилучшего Эрик :-D

— 20.12.2020 14:13

r regex

19.12.2020 20:10

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Вы можете использовать

x <- "\nMr. Johnson (spoke in \nRussian) (United Kingdom and \nNortheren Ireland) \n"
library(stringr)
str_replace_all(x, "\\([^()]*\\)", function(z) gsub("\n", "", z, fixed=TRUE) )
# => [1] "\nMr. Johnson (spoke in Russian) (United Kingdom and Northeren Ireland) \n"

Здесь \([^()]*\) соответствует подстроке между ( и ) без ( и ) между ними, а function(z) gsub("\n", "", z, fixed=TRUE) удаляет все символы перевода строки из каждого непересекающегося совпадения.

Также возможен базовый подход R:

x <- "\nMr. Johnson (spoke in \nRussian) (United Kingdom and \nNortheren Ireland) \n"
gr <- gregexpr("\\([^()]*\\)", x)
mat <- regmatches(x, gr)
regmatches(x, gr) <- lapply(mat, function(z) sub("\n", "", z, fixed=TRUE))
x
# => [1] "\nMr. Johnson (spoke in Russian) (United Kingdom and Northeren Ireland) \n"

Посмотрите эту демонстрацию R онлайн.

19.12.2020 20:18