Все вопросы с тегом Apache Spark

Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache Spark часто связаны с машинным / глубоким обучением и обработкой графиков.

Страница 1 из 1 390

Связанные теги

Pyspark
Spark Python API (PySpark) предоставляет Python модель программирования apache-spark.
Вопросы6336
Apache Spark Sql
Apache Spark SQL — это инструмент для «обработки SQL и структурированных данных» в Spark, быстрой и универсальной кластерной вычислительной системе. Его можно использовать для извлечения данных из Hive, Parquet и т. д. И выполнения SQL-запросов по существующим RDD и…
Вопросы4290
Apache Zookeeper
Apache ZooKeeper — это распределенная служба, которая обеспечивает хранение информации о конфигурации, присвоение имен, синхронизацию, координацию и групповые службы.
Вопросы455
Amazon Web Services
Amazon Web Services (AWS) — это общедоступное облако: IaaS (инфраструктура как услуга) и SaaS (программное обеспечение как услуга), предоставляемые Amazon.
Вопросы22337
Join
СОЕДИНЕНИЕ — это общая операция в реляционной алгебре для операции объединения двух или более отношений в системе реляционной базы данных. JOIN также является ключевым словом языка SQL для выполнения этой операции.
Вопросы4021
Python
Python — это мультипарадигмальный, динамически типизированный, многоцелевой язык программирования. Он разработан для быстрого изучения, понимания и использования, а также для обеспечения чистого и единообразного синтаксиса. Обратите внимание, что Python 2 официально не…
Вопросы303213