Databricks — как скопировать журналы драйверов на свой компьютер?

Я могу просматривать журналы с помощью команды %sh на узле драйвера блоков данных. Как я могу скопировать их на свой компьютер с Windows для анализа?

%sh cd журналы событий/4246832951093966440 журнал событий gunzip-2019-07-22--14-00.gz лс -л глава -1 eventlog-2019-07-22--14-00 Версия":"2.4.0","Timestamp":1563801898572,"Rollover Number":0,"SparkContext Id":4246832951093966440}

Спасибо

Стоит ли изучать PHP в 2026-2027 годах?
Стоит ли изучать PHP в 2026-2027 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
3
0
2 098
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Существуют разные способы копирования журналов драйверов на локальный компьютер.

Вариант 1: Журналы драйвера кластера:

Перейдите в рабочую область Azure Databricks => выберите кластер => щелкните Журналы драйверов => Для загрузки на локальный компьютер.

Прямые отчеты о печати и журнале из ваших ноутбуков и библиотек попадают в журналы драйверов. Журналы имеют три вывода:

  • Стандартный вывод

  • Стандартная ошибка

  • Журналы Log4j

Файлы журналов периодически меняются. Старые файлы журналов отображаются в верхней части страницы вместе с отметкой времени. Вы можете загрузить любой из журналов для устранения неполадок.

Вариант 2: Доставка журнала кластера:

При создании кластера можно указать место для доставки журналов драйверов и рабочих процессов Spark. Журналы доставляются каждые пять минут в выбранный вами пункт назначения. Когда кластер прекращает работу, Databricks гарантирует доставку всех журналов, созданных до момента остановки кластера.

Назначение журналов зависит от идентификатора кластера. Если указано место назначения dbfs:/cluster-log-delivery, журналы кластера для 0630-191345-leap375 доставляются в dbfs:/cluster-log-delivery/0630-191345-leap375.

Чтобы настроить место доставки журнала:

  1. На странице конфигурации кластера щелкните переключатель Дополнительные параметры.

  2. В нижней части страницы щелкните вкладку Ведение журнала.

  3. Выберите тип назначения.

  4. Введите путь к журналу кластера.

Чтобы загрузить журналы кластера на локальный компьютер:

Установите Интерфейс командной строки блоков данных, настройте его с помощью учетных данных Databricks и используйте команду CLI dbfs cp. Например: dbfs cp dbfs:/FileStore/azure.txt ./azure.txt.

Если вы хотите загрузить всю папку с файлами, вы можете использовать dbfs cp -r <DBFS Path> <LocalPath>.

  • Открыть командную строку.
  • Установите Python: https://www.python.org/downloads/
  • Установите блоки данных: pip install databricks-cli
  • Скопируйте хост и сгенерированный токен доступа.

    хост: https://centralus.azuredatabricks.net/?

    токен: 46546fgdsgfdhhh65fdh546sdsdrfdfghf12

  • Настройка блоков данных: запустите datbricks configure

Узел Databricks (должен начинаться с https://): https://centralus.azuredatabricks.net/

Имя пользователя: [email protected]

Пароль: вставьте токен доступа

Повторите для подтверждения: вставьте токен доступа

  • Теперь запустите приведенный ниже командлет, чтобы скопировать журналы на локальный компьютер.

dbfs cp -r dbfs:/cluster-logs/0731-081420-tees851/driver C:\Users\Azure\Desktop\Logs

Надеюсь это поможет.

Другие вопросы по теме

Похожие вопросы

Я хочу запустить вложенный запрос, где сначала выполните левое соединение, а затем вытащите данные, где объем> = 2 и дата за последние 3 месяца
Ошибка databricks для копирования и чтения файла из dbfs размером> 2 ГБ
Является ли когда-нибудь одна задача Spark многопоточной?
Цикл for для боке в databricks
Входные данные, полученные в нижнем регистре при потоковой передаче искры в блоках данных с использованием DataFrame
Проблема при записи данных в Delta Lake в Azure databricks (обнаружен несовместимый формат)
Какой менеджер кластера используется в Databricks? Как изменить количество исполнителей в кластерах Databricks?
Чтение данных из URL-адреса с использованием платформы Spark DataBricks
Создание пользовательской (не временной) функции в Spark-SQL для Azure Databricks
Таблица в azure databricks не обновляет и не перезаписывает свое содержимое. Как я могу сделать это программно, используя код Python?