Все вопросы с тегом Apache Spark

Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache Spark часто связаны с машинным / глубоким обучением и обработкой графиков.

Страница 1 из 1 375

Связанные теги

Azure
Microsoft Azure — это платформа для облачных вычислений «Платформа как услуга» и «Инфраструктура как услуга».
Вопросы20526
Pyspark
Spark Python API (PySpark) предоставляет Python модель программирования apache-spark.
Вопросы6157
Databricks
По вопросам о платформе унифицированной аналитики Databricks
Вопросы899
Apache Spark Sql
Apache Spark SQL — это инструмент для «обработки SQL и структурированных данных» в Spark, быстрой и универсальной кластерной вычислительной системе. Его можно использовать для извлечения данных из Hive, Parquet и т. д. И выполнения SQL-запросов по существующим RDD и…
Вопросы4244
Dataframe
Фрейм данных — это табличная структура данных. Обычно он содержит данные, где строки представляют собой наблюдения, а столбцы - переменные различных типов. Хотя термин «фрейм данных» или «фрейм данных» используется для этой концепции на нескольких языках (R, Apache…
Вопросы23078
Scala
Scala — это язык программирования общего назначения, ориентированный главным образом на виртуальную машину Java. Разработанный для краткого, элегантного и типобезопасного выражения общих шаблонов программирования, он объединяет в себе императивные и функциональные…
Вопросы13548