Получайте результаты от стороннего API и выгружайте результаты в S3

Я новичок в AWS и облачных сервисах в целом. Что я планирую делать, так это постоянно получать данные от стороннего API, который возвращает результаты в JSON за раз (по 3-5 МБ каждый) и сбрасывать результаты в корзину S3. Я хочу автоматизировать процесс, и мое решение на данный момент — запустить скрипт Python на экземпляре EC2, чтобы получить результаты и передать их в корзину S3, как я бы сделал это вручную на локальном компьютере. Это способ добиться такого сбора данных? Поскольку я новичок в этом, я хочу остаться в пределах бесплатного уровня. Заранее спасибо.

amazon-web-services amazon-s3 amazon-ec2

19.03.2019 13:16

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

441

Ответы 1

Вы не указали типичный размер ответа от API. Насколько я понимаю, это экспериментальный проект. Надеюсь, эти советы помогут:

Взгляните на страница уровня бесплатного пользования aws
Используйте t2.микро
Настройте оповещения о выставлении счетов на aws — всякое может случиться, платить 5 долларов все же лучше, чем платить 500 долларов.

Я не уверен, что вы уже используете s3, но также следует учитывать некоторые моменты:

Рассчитайте, сколько данных вы будете хранить в МБ
Настройте политику жизненного цикла на s3 для удаления объектов, которым N дней (если они вам не нужны).
Убедитесь, что управление версиями отключено (если вам это не нужно)

Из документации: после регистрации новые клиенты AWS получают 5 ГБ хранилища Amazon S3 класса Стандарт Storage, 20 000 запросов на получение, 2000 запросов на размещение и 15 ГБ передачи данных из каждый месяц на один год.

Итак, вы, вероятно, хотите помещать объекты в s3 пакетами (я имею в виду, что один объект будет содержать несколько ответов от API). Если скрипт будет запускаться каждую секунду и отправлять объекты на s3, похоже, что 2000 бесплатных запросов на размещение являются узким местом.

цены на с3

Удачи :)

Спасибо за Ваш ответ! Прямо сейчас я получаю то, что хотел, запустив скрипт Python на экземпляре ec2 в фоновом режиме (nohup). Однако для этого требуется, чтобы экземпляр работал (и потреблял квоту) непрерывно, в то время как я делаю дамп данных только каждые несколько часов. Я рассматриваю решение с использованием AWS Lambda, которое не требует постоянной работы экземпляра.

— 28.03.2019 15:35

19.03.2019 17:22