У нас установлен Airflow с использованием GCP Composer, и у всех нас внезапно отключился веб-сервер/планировщик.
Мы только что попытались перезапустить, обновив некоторые фиктивные переменные или рабочие узлы, и всегда получали ошибку ниже.
Error: UPDATE operation on this environment failed 1 hour ago with the following error message:
Operation failed. Couldn't start composer-agent, a GKE job that updates kubernetes resources. Please check if your GKE cluster exists, is healthy and contains non-empty 'default-pool' node pool.
Любое предложение, поскольку наша среда полностью застряла.
Насколько я понимаю, модуль агента композитора не может получить образы контейнеров из-за неправильных записей DNS для частного доступа Google к *.pkg.dev. Я думаю, у вас будут только записи для *.gcr.io, так как именно здесь раньше размещались изображения. Дополнительная информация здесь
Делали ли вы какие-либо конфронтационные изменения перед выпуском?