Перемещение между регионами — перенос данных Big Query и GCS из США в страны ЕС

Для соответствия требованиям мы хотели бы переместить все наши данные Bigquery и данные GCS из региона США в регион ЕС. Насколько я понимаю, мультирегиональность находится либо в США, либо в ЕС. Межрегионального варианта как такового нет.

Вопрос 1: Чтобы переместить данные из США в ЕС или наоборот, мы понимаем, что нам нужно явно переместить данные с помощью службы передачи хранилища. И учитывая стоимость, связанную с этим перемещением, даже если оно находится в облаке Google?

Вопрос 2: Мы также думаем, сможем ли мы хранить копии в обоих местах. В этом случае предусмотрена ли межрегиональная репликация? Если да, то какова будет соответствующая стоимость за то же самое?

Стоит ли изучать PHP в 2023-2024 годах?
Стоит ли изучать PHP в 2023-2024 годах?
Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией
В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.
Приемы CSS-макетирования - floats и Flexbox
Приемы CSS-макетирования - floats и Flexbox
Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...
Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest
В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...
Концепция локализации и ее применение в приложениях React ⚡️
Концепция локализации и ее применение в приложениях React ⚡️
Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...
Пользовательский скаляр GraphQL
Пользовательский скаляр GraphQL
Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...
0
0
352
2
Перейти к ответу Данный вопрос помечен как решенный

Ответы 2

Согласно документам, после создания набора данных местоположение нельзя изменить, но вы можете скопировать набор данных в другое место или вручную переместить (воссоздать) набор данных в другое место.

Более простой подход — копирование, вы можете узнать больше о требованиях, квотах и ​​ограничениях здесь: https://cloud.google.com/bigquery/docs/copying-datasets

Так:

  1. Нет необходимости в услуге переноса, вы можете копировать наборы данных в другое место.
  2. Отсутствует механизм автоматической репликации между регионами. Даже для политики аварийного восстановления потребуются копии наборов данных между регионами.

BigQuery не создает автоматически резервную копию или реплику ваших данных в другом географическом регионе. Вы можете создавать копии наборов данных между регионами, чтобы улучшить свою стратегию аварийного восстановления.

https://cloud.google.com/bigquery/docs/availability#:%7E:text=cross%2Dregion%20dataset%20copies

Таким образом, в обоих случаях вам нужно работать с копиями набора данных и иметь дело со свежестью данных во втором сценарии.

Ответ принят как подходящий

Вопрос 1:

Вы перемещаете данные из одной части мира в другую. Итак, да, вы заплатите стоимость выхода из исходного местоположения.

К сожалению, сегодня (28 ноября 2023 г.) я не могу на 100 % оплатить эту стоимость. Действительно, я связался с Google Cloud по очень похожему вопросу, и мой контакт в Google Cloud сказал мне, что страница стоимости устарела. Должна применяться стоимость исходящего трафика облачного хранилища (вместо стоимости исходящего трафика Compute Engine Networking, как сегодня указано в документации).


Вопрос 2:

Вы копируете данные, поэтому в конце у вас есть объем данных, дублированный в 2 набора данных, и у вас дублируется стоимость хранения.

Каждый раз, когда вы хотите синхронизировать данные, вы выполняете копирование. Это только копия, а не смарт-дельта-обновление. Поэтому будьте осторожны, если вы обновляете данные непосредственно в целевом наборе данных: новая копия переопределит данные!

Вместо этого используйте целевой набор данных в качестве основы для запроса и продублируйте (снова) данные в независимом наборе данных, куда вы можете добавить данные, специфичные для вашего региона.

Существуют ли какие-либо ограничения на копирование имени набора данных/таблицы между регионами. Например: DATASET1 и таблица Customer. Могу ли я реплицировать одно и то же имя набора данных и имя таблицы в другом регионе? Идея состоит в том, чтобы использовать тот же код для запуска запроса, за исключением изменения региона?

Sunil 30.11.2022 04:52

Имя набора данных должно быть уникальным для каждого проекта. Мое решение состоит в том, чтобы добавить суффикс/префикс к набору данных для каждого региона.

guillaume blaquiere 30.11.2022 09:42

Другие вопросы по теме

Я не могу развернуть облачные функции firebase: не удалось загрузить определение функции из источника, основной «экспорт» не определен в D:\
Gcs-connector Hadoop 3 не работает должным образом с последней версией автономного режима spark 3
Загрузка большого файла (800 МБ) с URL-адреса в корзину GCS с использованием облачной функции
При использовании Google Cloud Storage возникает ошибка 500 на веб-сайте, размещенном на сервере Amazon
Как загрузить из Google Cloud Storage с помощью Alpakka-gcs без предоставления секретного ключа?
В каком регионе облачная сборка выполняет свои сборки?
Как я могу отображать изображения, размещенные в облачном хранилище, в Google Data Studio?
Невозможно отключить унифицированный уровень сегмента
У меня есть хранилище gcp с более чем 1000 изображений. Какой самый простой способ получить текстовый файл, в котором перечислены все URL-адреса объектов в корзине?
Сценарий запуска GCE Windows