Статьи об Azure HDInsight - управляемой службе Apache Hadoop, которая позволяет запускать Apache Spark, Apache Hive, Apache Kafka, Apache HBase и другие в облаке Microsoft Azure.
Amazon Elastic MapReduce (Amazon EMR) — это веб-сервис, который позволяет предприятиям, исследователям, аналитикам данных и разработчикам легко и экономично обрабатывать огромные объемы данных. Он использует размещенную структуру Hadoop, работающую в масштабируемой…
Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache…
Фабрика данных Microsoft Azure — это облачная служба, используемая для вызова (оркестровки) других служб Azure контролируемым образом с использованием концепции временных интервалов. Фабрики данных в основном разрабатываются с использованием вручную созданного JSON…