Python 3: нужно ли использовать кодировку unicode_escape?

Эта ссылка перечисляет некоторые специфичные для Python кодировки.

Одна из кодировок - unicode_escape.

Я просто пытаюсь понять, действительно ли нужна эта специальная кодировка?

>>> l = r'C:\Users\userx\toot'
>>> l
'C:\\Users\\userx\\toot'
>>> l.encode('unicode_escape').decode()
'C:\\\\Users\\\\userx\\\\toot'

Если вы могли видеть выше, 'l', который является объектом Unicode, уже позаботился об экранировании обратной косой черты. Преобразование его в кодировку unicode_escape добавляет еще один набор экранированных обратных косых черт, что для меня не имеет никакого смысла.

Вопросы:

Действительно ли нужна кодировка unicode_escape?
почему "unicode_escape" добавил еще один набор обратных косых черт выше?

Если вы используете print(l), вы увидите, что в фактическом содержимом строки обратная косая черта не экранируется. Версия строки repr избегает обратной косой черты, чтобы однозначно показать ее вам, разработчику.

— 18.11.2018 16:07

Как вы думаете, почему unicode_escape()является или было бы необходимы для вашего варианта использования? Просто потому, что что-то существует, это не значит, что это важно или актуально для вас.

— 18.11.2018 16:15

@CharlesDuffy Я пишу скрипт на Python, который принимает в качестве аргумента путь в стиле Windows. Таким образом, скрипт работает без проблем. Я просто хотел убедиться, есть ли случаи, когда мне нужно преобразовать ввод arg с помощью unicode_escape?

— 18.11.2018 16:18

Назначение unicode_escape() - генерировать контент, который можно подставить непосредственно в исходный файл Python в обычном формате ASCII. Вы этого не делаете, значит, вам это не нужно.

— 18.11.2018 16:19

@CharlesDuffy Не могли бы вы привести мне пример, в котором нужно «генерировать контент, который может быть заменен непосредственно в исходный файл Python в обычном формате ASCII»?

— 18.11.2018 16:27

Хм. Я потенциально мог бы увидеть необходимость в этом, если бы вы писали декомпилятор Python (хотя существующие декомпиляторы с такой же вероятностью реализуют эту функцию непосредственно сами, как и используют то, что предоставляет библиотека). Я также видел генерацию кода, используемую для генерации механизма шаблонов, хотя более свежие / современные примеры строят деревья AST, а не текстовый источник.

— 18.11.2018 16:40

Честно говоря, "как можно использовать X?" это полностью открытый вопрос, и мы не разрешаем его здесь. Вопросы должны быть конкретными и основываться на реальной проблеме, с которой вы сталкиваетесь.

— 18.11.2018 16:42

@CharlesDuffy Понятно! Спасибо за пример.

— 18.11.2018 16:50

python python-3.x unicode python-unicode

18.11.2018 16:04

Почему в Python есть оператор "pass"?

Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.

Некоторые методы, о которых вы не знали, что они существуют в Python

Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...

Основы Python Часть I

Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?

LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа

Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:

Оптимизация кода с помощью тернарного оператора Python

И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это

Советы по эффективной веб-разработке с помощью Python

Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.

1 348

Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Цитата документ, который вы связали:

Encoding suitable as the contents of a Unicode literal in ASCII-encoded Python source code, except that quotes are not escaped. Decodes from Latin-1 source code. Beware that Python source code actually uses UTF-8 by default.

Таким образом, print(l.encode('unicode_escape').decode()) делает что-то почти точно эквивалентенprint(repr(l)), за исключением того, что он не добавляет кавычки снаружи и escape-кавычки внутри строки.

Когда вы отключаете print(), REPL выполняет repr() по умолчанию, поэтому вы дважды экранируете обратную косую черту - точно так же, как и при запуске >>> repr(l).

18.11.2018 16:17

Другие вопросы по теме

Таблица имеет более одного первичного ключа Django

Возвращает список общих индексов для двух сжатых векторов

Multipart-form-data, метод POST, с множественными формами на странице

Графический процессор TensorFlow: без повышения производительности в коде HelloWorld

Ошибка отображения, когда значение, добавленное в поле ввода, не является значением int

Циклический текст перед каждой строкой

VSCode - правильный проект Python с отладкой зависимостей

Как добавить консоль Python в программу C / C++

Доступ на чтение к Google Drive API не предоставлен

Произошло исключение: FileNotFoundError [Errno 2] Нет такого файла или каталога: 'data.json'

Python 3: нужно ли использовать кодировку unicode_escape?

Ответы 1

Другие вопросы по теме

Похожие вопросы