Spark Streaming — это расширение основного API Apache Spark, которое обеспечивает высокопроизводительную и отказоустойчивую потоковую обработку потоков данных в реальном времени. Начиная с версии 1.3.0, он поддерживает семантику однократной обработки даже при сбоях.