Как сохранить несжатые результаты учебного задания при использовании aws Sagemaker python SDK?

Я пытаюсь загрузить артефакты учебного задания на S3 в несжатом виде.

Я знаком с output_dir, который можно предоставить оценщику sagemaker, тогда все, сохраненное в /opt/ml/output, загружается в сжатом виде в выходной каталог S3.

Я хочу иметь возможность доступа к определенному артефакту без необходимости каждый раз распаковывать вывод. Есть ли чистый способ сделать это? если нет никакого обходного пути? Артефакты, которые меня интересуют, представляют собой небольшие файлы метаданных .txt или .csv, в то время как в моем случае остальные артефакты могут иметь размер ~ 1 ГБ, поэтому загрузка и распаковка довольно чрезмерны.

любая помощь будет оценена

Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
2
0
397
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Я думаю, вы можете просто указать путь к местоположению s3, чтобы сохранить свой артефакт в своем обучающем сценарии. Однако я не совсем уверен, что экземпляры, созданные sagemaker, имеют разрешение на прямую запись в S3, возможно, они также изолированы от сети. Я делаю более или менее то, что вы говорите, чтобы читать журналы tensorflow в реальном времени, но я использую собственное изображение для обучения. Если вам интересно, вы можете посмотреть здесь

спасибо, я попробовал то, что вы описываете, но экземпляры EC2 не имеют зарегистрированных учетных данных AWS ... поэтому у вас нет разрешения

Alex Finkelshtein 23.12.2020 19:10

> Я попробовал то, что вы описываете, но экземпляры EC2 не имеют зарегистрированных учетных данных AWS. Я не думаю, что это обязательно верно. Вы должны иметь возможность получить сеанс AWS в контейнере. Предполагается, что ваша роль IAM должна иметь учетные данные. Вы можете управлять доступом для чтения S3 в этой роли.

Akshaya Shanbhogue 11.02.2022 05:51
Ответ принят как подходящий

В итоге я использовал путь контрольной точки, который по умолчанию синхронизируется с указанным путем S3 в несжатом виде.

Другие вопросы по теме