Удалите вывод ansi escape из файла журнала с помощью cat/ansifilter или любых других инструментов

У меня есть результаты тестов на соответствие Kubernetes.

\u001b[90mtest/e2e/common/network/framework.go:23\u001b[0m
  Granular Checks: Pods
  \u001b[90mtest/e2e/common/network/networking.go:32\u001b[0m
    should function for intra-pod communication: udp [NodeConformance] [Conformance]
    \u001b[90mtest/e2e/framework/framework.go:652\u001b[0m
\u001b[90m------------------------------\u001b[0m

Я хочу прочитать вывод, удалив все escape-последовательности. У меня нет контроля над кодом, поэтому я чувствую себя с помощью cat, less -r, ansifilter и т. д.; даже сед.

Но ничто из этого не помогает мне удалить escape-последовательности. Как я могу их удалить?

sed 's/\x1B\[[0-9;]\{1,\}[A-Za-z]//g' может «обескрасить» свой ввод

— 28.08.2024 00:01

Я пробовал это, но на Mac мне не помогло.

— 28.08.2024 00:02

Итак, ваш ввод буквально начинается с обратной косой черты, u, нуля и т. д., а не с escape-символа Юникода \u001b?

— 28.08.2024 00:05

пожалуйста, обновите вопрос, указав некоторые из ваших попыток кодирования, (неправильные) результаты, полученные указанным кодом, и (правильный) ожидаемый результат; также, пожалуйста, разверните свой ответ на комментарий pmf - didn't help me - ошибка? неправильный ответ? нет ответа? что-то еще?

— 28.08.2024 00:05

рассмотрите возможность передачи вывода в xxd, а затем обновите вопрос результатами; затем мы можем использовать xxd -r, чтобы воссоздать точный результат в вашей системе.

— 28.08.2024 00:10

bash

27.08.2024 23:52

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Единственным решением, которое сработало для меня, был этот фрагмент.

import re
import sys

output_file = sys.argv[1]
print(output_file)

def remove_escapes(text):
    # First, replace Unicode escape sequences
    text = text.encode('ascii', 'ignore').decode('unicode_escape')

    # Then, remove ANSI escape sequences
    ansi_escape = re.compile(r'\x1B(?:[@-Z\\-_]|\[[0-?]*[ -/]*[@-~])')
    return ansi_escape.sub('', text)


for line in open(output_file):
    try:

        parsed_line = remove_escapes(line)
    except UnicodeDecodeError:
        print("UnicodeDecodeError: " + line)
        continue
    print(parsed_line, end='')

28.08.2024 00:03

Ответ принят как подходящий

Последовательности CSI (Control Sequence Introducer)

Для команд Control Sequence Introducer, или CSI, за ESC[ (записанным как \e[ или \033[ на нескольких языках программирования) следует любое количество (в том числе отсутствие) «байтов параметров» в диапазоне 0x30–0x3F (ASCII 0–9:;<=>?), а затем любой количество «промежуточных байтов» в диапазоне 0x20–0x2F (ASCII space и !"#$%&'()*+,-./), затем, наконец, на один «последний байт» в диапазоне 0x40–0x7E (ASCII @A–Z[\]^_`a–z{|}~).

Таким образом, решение POSIX для удаления этих CSI может быть следующим:

LANG=C awk '{ gsub(/\033\[[0-?]*[ -/]*[@-~]/, ""); print }'

редактировать

Поскольку ESC CSI кажутся экранированными в формате JSON, вы можете использовать:

LANG=C awk '{ gsub(/\\u001[bB]\[[0-?]*[ -/]*[@-~]/, ""); print }'

28.08.2024 00:10

Другие вопросы по теме

Откройте VSCode в определенной виртуальной среде

Принудительное разделение слов для резервного значения в sh/bash

Как сделать переменную env подоболочки доступной в основной консоли Python оболочки?

Как увеличить поле, если запись уже существует?

Sed + сопоставить слово в строках и заменить значение некоторыми условиями

Исключить последний символ при печати в цикле for

Сохранять вывод команды в файл и в переменную одновременно

Скручивайте список ссылок и сохраняйте файлы в соответствии с иерархией URL-адресов

В bash, как мне отделить escape-последовательность от фактического числа?

Передача флага в Bash интерпретируется неправильно

Удалите вывод ansi escape из файла журнала с помощью cat/ansifilter или любых других инструментов

Ответы 2

Другие вопросы по теме

Похожие вопросы