Все вопросы с тегом Spark Structured Streaming

Структурированная потоковая передача Spark позволяет обрабатывать потоки данных в реальном времени с помощью API DataFrame и Dataset.

Страница 1 из 51

Связанные теги

Apache Spark
Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache…
Вопросы13893
Pyspark
Spark Python API (PySpark) предоставляет Python модель программирования apache-spark.
Вопросы6336
Apache Kafka Streams
Связан со встроенным механизмом обработки потоков Apache Kafka под названием Kafka Streams, который представляет собой библиотеку Java для создания приложений распределенной обработки потоков с использованием Apache Kafka.
Вопросы993
Spark Streaming Kafka
Интеграция Spark Streaming для Kafka. Подход Direct Stream обеспечивает простой параллелизм, соответствие 1: 1 между разделами Kafka и разделами Spark, а также доступ к смещениям и метаданным.
Вопросы45
Databricks
По вопросам о платформе унифицированной аналитики Databricks
Вопросы1013
Spark Streaming
Spark Streaming — это расширение основного API Apache Spark, которое обеспечивает высокопроизводительную и отказоустойчивую потоковую обработку потоков данных в реальном времени. Начиная с версии 1.3.0, он поддерживает семантику однократной обработки даже при сбоях.
Вопросы788