Apache Spark SQL — это инструмент для «обработки SQL и структурированных данных» в Spark, быстрой и универсальной кластерной вычислительной системе. Его можно использовать для извлечения данных из Hive, Parquet и т. д. И выполнения SQL-запросов по существующим RDD и Datasets.