Я использую инкрементную контрольную точку с RocksDB и сохраняю контрольные точки в удаленном месте назначения (в моем случае S3). Что произойдет, если кто-то удалит сервер менеджера заданий (где работает координатор контрольной точки) и переустановит его? Потеряв координатора чекпойнтов, я также теряю возможность восстановить состояние из чекпойнтов? потому что из того, что я знаю, координатор держит все ссылки на контрольно-пропускные пункты.
Если вы запустите Flink с включенным высокая доступность, то Flink сохранит указатели на свои контрольные точки в ZooKeeper. В случае сбоя JobManager
Flink восстановит все контрольные точки из ZooKeeper и сможет возобновить задания с последней завершенной контрольной точки.