Преимущества переноса логики синтаксического анализа сообщений с Spark на Kafka

В настоящее время я работаю над вариантом использования, который требует чтения сообщений JSON от Kafka и обработки их в Spark с помощью потоковой передачи Spark. Мы ожидаем около 35 миллионов записей в день. При такой загрузке предпочтительнее переместить логику синтаксического анализа (и некоторую логику фильтрации на основе JValue) в Kafka, используя Custom Kafka Deserializer (расширяющий класс org.apache.kafka.common.serialization.Deserializer). Будет ли это иметь накладные расходы на производительность? Спасибо.

Вам также следует взглянуть на Streams API Kafka и KSQL. Оба предоставляют высокопроизводительные, распределенные и гибкие возможности потоковой обработки данных в Kafka.

— 14.03.2018 11:30

Спасибо Робин за быстрый ответ. Однако из-за нашей сложной логики обработки мы подумали о продолжении использования Spark Streaming вместо KStreams API.

— 14.03.2018 13:19

Ради интереса, что вы не можете делать с KStreams, что вы будете делать с Spark Streaming?

— 14.03.2018 15:00

Также из интереса, почему не Авро? Вы можете сэкономить так много пропускной способности сети с помощью двоичного сжатия

— 15.03.2018 06:34

наш вариант использования касается обработки нескольких потоков событий, происходящих в произвольном темпе. И нам нужно объединить эти случайные потоки, которые не привязаны ко времени. Например, поток может прийти через 3 или 4 дня, и нам нужно объединить эти два потока, чтобы прийти к какому-то значимому выводу. Кроме того, у нас есть данные в Hive, которые необходимо учитывать при присоединении к этим потокам. Следовательно, планирование Spark.

— 15.03.2018 07:28

apache-spark apache-kafka spark-streaming

14.03.2018 10:16

Стоит ли изучать PHP в 2026-2027 годах?

Привет всем, сегодня я хочу высказать свои соображения по поводу вопроса, который я уже много раз получал в своем сообществе: "Стоит ли изучать PHP в...

Поведение ключевого слова "this" в стрелочной функции в сравнении с нормальной функцией

В JavaScript одним из самых запутанных понятий является поведение ключевого слова "this" в стрелочной и обычной функциях.

Приемы CSS-макетирования - floats и Flexbox

Здравствуйте, друзья-студенты! Готовы совершенствовать свои навыки веб-дизайна? Сегодня в нашем путешествии мы рассмотрим приемы CSS-верстки - в...

Тестирование функциональных ngrx-эффектов в Angular 16 с помощью Jest

В системе управления состояниями ngrx, совместимой с Angular 16, появились функциональные эффекты. Это здорово и делает код определенно легче для...

Концепция локализации и ее применение в приложениях React ⚡️

Локализация - это процесс адаптации приложения к различным языкам и культурным требованиям. Это позволяет пользователям получить опыт, соответствующий...