Все вопросы с тегом Pyspark

Spark Python API (PySpark) предоставляет Python модель программирования apache-spark.

Страница 1 из 634

Связанные теги

Apache Spark
Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache…
Вопросы13893
Apache Spark Sql
Apache Spark SQL — это инструмент для «обработки SQL и структурированных данных» в Spark, быстрой и универсальной кластерной вычислительной системе. Его можно использовать для извлечения данных из Hive, Parquet и т. д. И выполнения SQL-запросов по существующим RDD и…
Вопросы4290
Apache Zookeeper
Apache ZooKeeper — это распределенная служба, которая обеспечивает хранение информации о конфигурации, присвоение имен, синхронизацию, координацию и групповые службы.
Вопросы455
Python
Python — это мультипарадигмальный, динамически типизированный, многоцелевой язык программирования. Он разработан для быстрого изучения, понимания и использования, а также для обеспечения чистого и единообразного синтаксиса. Обратите внимание, что Python 2 официально не…
Вопросы303213
Spark Streaming
Spark Streaming — это расширение основного API Apache Spark, которое обеспечивает высокопроизводительную и отказоустойчивую потоковую обработку потоков данных в реальном времени. Начиная с версии 1.3.0, он поддерживает семантику однократной обработки даже при сбоях.
Вопросы788
Azure Databricks
По вопросам использования Databricks Unified Analytics Platform в Microsoft Azure
Вопросы552