Я читаю CSV, который содержит два типа даты:
Я пытаюсь преобразовать все даты первого типа во второй тип, но не могу найти хорошего решения. Я пытаюсь это:
val pr_date = readeve.withColumn("Date", when(to_date(col("Date"),"dd-MMM-yyyy hh:mm:ss").isNotNull,
to_date(col("Date"),"dd/MM/yyyy hh:mm")))
pr_date.show(25)
И я получаю весь столбец Date как нулевые значения:
Я пытаюсь с этой функцией:
def to_date_(col: Column,
formats: Seq[String] = Seq("dd-MMM-yyyy hh:mm:ss", "dd/MM/yyyy hh:mm")) = {
coalesce(formats.map(f => to_date(col, f)): _*)
}
val p2 = readeve.withColumn("Date",to_date_(readeve.col(("Date")))).show(125)
И в первом типе даты я тоже получаю нули:
Что я делаю не так? (новинка в Scala Spark)
Скала версия: 2.11.7 Искра версия: 2.4.3
Попробуйте код ниже? Обратите внимание, что 17
— это HH
, а не hh
. Также попробуйте to_timestamp
вместо to_date
, потому что вы хотите сохранить время.
val pr_date = readeve.withColumn(
"Date",
coalesce(
date_format(to_timestamp(col("Date"),"dd-MMM-yyyy HH:mm:ss"),"dd/MM/yyyy HH:mm"),
date_format(to_timestamp(col("Date"),"dd/MM/yyyy HH:mm"),"dd/MM/yyyy HH:mm")
)
)