Я пытаюсь найти способ получить дату и время последнего обновления для каждого раздела. Например, если раздел 15-04-23 был создан 15 марта, а новый файл был добавлен в этот раздел 18-го числа, я ожидаю, что дата последнего обновления будет 18 марта. Есть ли способ получить эту информацию.
Я занимаюсь исследованиями и разработками и пока ничего не нашел
Этот запрос даст вам время изменения файла новейшего объекта в каждом разделе:
select "$partition", max("$file_modified_time") as max_file_modified_time
from my_table
group by 1
order by 1
Этот запрос сканирует нулевые байты, но в зависимости от количества разделов в вашей таблице он может выполнить множество операций S3, поэтому он не бесплатен.
Запрос использует столбец метаданных $partition
, который будет строковым представлением объединенных ключей раздела. Вы также можете напрямую использовать имена ключей разделов. Если в вашей таблице есть ключи разделов date
, category
, запрос может выглядеть так:
select date, category, max("$file_modified_time") as max_file_modified_time
from my_table
group by 1, 2
order by 1, 2
Что вы уже пробовали? С какой проблемой вы столкнулись?