У меня есть проект потоковой передачи Apache Beam, который вычисляет данные и записывает их в базу данных. Как лучше всего повторно обработать все исторические записи после исправления ошибки или после изменения способа обработки данных без большой задержки?





Это очень зависит от приложения.
Например, простой подход, если вы используете Kafka (и все данные там):