как мне выйти (принудительно выдав сообщение об ошибке) из программы Spark, если, например, условие соединения -my не выполняется?
Пример-
Данные сотрудника - emp_id, dep_no
1,1001 2,2001
Данные отдела - dep_no, dept_name, location
1001, xyz, NY 3001, pqr, PA
Теперь, если я хочу обогатить данные о сотрудниках, мне нужно выполнить соединение с данными отдела. Все, что мне нужно, это всякий раз, когда я не нахожу отдел в данных отдела (мое соединение не удастся), я хочу остановить процесс (ошибка) с помощью специального сообщения об ошибке в Spark (Scala).
Спасибо, Сид





В зависимости от вашего варианта использования вы можете использовать один из следующих методов SparkContext:
def cancelJob(jobId: Int, reason: String): Unit
def cancelJobGroup(groupId: String)
def cancelAllJobs()
Несколько полезных звонков:
def applicationId: String // to get current jobId
def setJobGroup(groupId: String, description: String, interruptOnCancel: Boolean = false) // to set groupId for all Spark jobs to be created by the current thread
Используйте Try Catch в коде для создания настраиваемого исключения