C++ Escape вхождений \ в строке

Есть ли простой способ избежать всех вхождений \ в строку? Я начинаю со следующей строки:

#include <string>
#include <iostream>

std::string escapeSlashes(std::string str) {
    // I have no idea what to do here
    return str;
}

int main () {
    std::string str = "a\b\c\d";

    std::cout << escapeSlashes(str) << "\n";
    // Desired output:
    // a\\b\\c\\d

    return 0;
}

В основном я ищу вопрос, обратный это. Проблема в том, что я не могу найти \ в строке, потому что C++ уже рассматривает его как escape-последовательность.

ПРИМЕЧАНИЕ:Во-первых, я не могу изменить строку str. Он анализируется из файла LaTeX. Таким образом, это ответов на аналогичный вопрос не применяется.Редактировать: Анализ не удался из-за несвязанной проблемы, вопрос здесь о строковых литералах.

Редактировать: Есть хорошие решения для поиска и замены известных escape-последовательностей, таких как ответ это. Другой вариант - использовать boost::regex("\p{cntrl}"). Однако я не нашел ни одного, который работал бы с неизвестными (ошибочными) escape-последовательностями.

Как насчет того, чтобы показать образец файла и код синтаксического анализа?

spectras 22.03.2018 11:38

Добавляйте \ перед каждой косой чертой и попробуйте

Rajesh 22.03.2018 11:39

Для поиска специальных символов поместите перед ними \ , например \\ . Вам не нужно изменять данные источник.

Panagiotis Kanavos 22.03.2018 11:40

Кстати, вам также не нужно «избегать» исходных данных. Это нормально и так. Если вы попытаетесь проверить символы в отладчике, вы увидите, что символ \ отображается как \\ . Экранирование необходимо только для строковых литералов в исходном коде. Если бы вы использовали cout << str, вы бы увидели исходную строку без изменений

Panagiotis Kanavos 22.03.2018 11:42

Я бы предпочел не трогать код парсинга. Возникает связанный с этим вопрос: есть ли способ найти в строке escape-символ любой?

Julian Helfferich 22.03.2018 11:50

Что вы имеете в виду под "Это проанализировано из файла LaTeX"? У вас есть сценарий, который извлекает строки из ваших источников LaTeX и производит исходный код C++ в качестве вывода? (В этом случае исправьте сценарий.) Или ваш код C++ читает LaTeX в качестве входных данных? (В этом случае у вас уже есть буквальные символы \ в вашей строке, и ваш примерный код не отражает то, что вы делаете.)

Toby Speight 22.03.2018 14:16

Я обнаружил проблему с парсером, и она не связана с этим вопросом. Пытаясь понять проблему, используя строковые литералы вместо анализируемой строки, я только усугубил ситуацию. Я удалю записку, так как она вводит в заблуждение.

Julian Helfferich 22.03.2018 14:38
Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
7
198
2

Ответы 2

Вы можете использовать необработанный строковый литерал. См. http://en.cppreference.com/w/cpp/language/string_literal

#include <string>
#include <iostream>

int main() {
    std::string str = R"(a\b\c\d)";

    std::cout << str << "\n";
    return 0;
}

Выход:

a\b\c\d

Невозможно преобразовать строковый литерал a\b\c\d в a\\b\\c\\d, т.е. избежать обратной косой черты.

Почему? Поскольку компилятор преобразует \c и \d непосредственно в c и d, соответственно, выдает предупреждение о Unknown escape sequence \c и Unknown escape sequence \d (\b в порядке, поскольку это допустимая escape-последовательность). Это происходит непосредственно со строковым литералом, прежде чем вы сможете с ним работать.

Чтобы убедиться в этом, вы можете скомпилировать на ассемблер

gcc -S main.cpp

и вы найдете следующую строку где-нибудь в своем ассемблерном коде:

.string "a\bcd"

Таким образом, ваша проблема либо в вашей функции синтаксического анализа, либо вы используете строковые литералы для экспериментов, и вместо этого вы должны использовать необработанные строки R"(a\b\c\d)".

Другие вопросы по теме