У меня есть набор потоковых данных. Он читает из потока Kafka и записывает в консоль.
val outputStream = inputStream.writeStream.format("console")
.option("truncate", value = false)
.option("checkpointLocation", "checkpoint")
outputStream.start()
spark.streams.awaitAnyTermination()
Однако, когда есть более одной записи, я получаю сообщение на консоли:
only showing top 20 rows
И он показывает только 20 записей. Есть ли способ получить все записи ??
Искра версия: 3.1.2
Есть вариант numRows
, например: 10000.
val outputStream = inputStream.writeStream.format("console")
.option("truncate", value = false)
.option("numRows",10000)
.option("checkpointLocation", "checkpoint")
попробуйте использовать следующее
.outputMode("complete")