Amazon s3: получение даты последнего обновления раздела в каталоге клея Athena/AWS

Я пытаюсь найти способ получить дату и время последнего обновления для каждого раздела. Например, если раздел 15-04-23 был создан 15 марта, а новый файл был добавлен в этот раздел 18-го числа, я ожидаю, что дата последнего обновления будет 18 марта. Есть ли способ получить эту информацию.

Что вы уже пробовали? С какой проблемой вы столкнулись?

oOosys 18.04.2024 10:05

Я занимаюсь исследованиями и разработками и пока ничего не нашел

Nabeel Khan Ghauri 18.04.2024 10:32
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
2
54
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

Этот запрос даст вам время изменения файла новейшего объекта в каждом разделе:

select "$partition", max("$file_modified_time") as max_file_modified_time
from my_table
group by 1
order by 1

Этот запрос сканирует нулевые байты, но в зависимости от количества разделов в вашей таблице он может выполнить множество операций S3, поэтому он не бесплатен.

Запрос использует столбец метаданных $partition, который будет строковым представлением объединенных ключей раздела. Вы также можете напрямую использовать имена ключей разделов. Если в вашей таблице есть ключи разделов date, category, запрос может выглядеть так:

select date, category, max("$file_modified_time") as max_file_modified_time
from my_table
group by 1, 2
order by 1, 2

Другие вопросы по теме