Apache Spark — это механизм распределенной обработки данных с открытым исходным кодом, написанный на Scala, предоставляющий пользователям унифицированный API и распределенные наборы данных как для пакетной, так и для потоковой обработки. Сценарии использования Apache Spark часто связаны с машинным / глубоким обучением и обработкой графиков.