Как работает система ценообразования s3 select? какие данные возвращаются и сканируются в s3 select означает

У меня есть 1 миллион строк данных CSV. выберите 10 строк, мне будет выставлен счет за 10 строк. Что означают возвращаемые и отсканированные данные в S3 Select?

По этим условиям S3 select документации меньше.

Пометить это как prestodb, так как это относится и к самому Presto (github.com/prestodb/presto/pull/11033).

Piotr Findeisen 05.11.2018 09:22
8
1
5 598
1

Ответы 1

Для простоты давайте на некоторое время забудем, что S3 читает столбцы. Предположим, у вас есть следующие данные:

| City       | Last Updated Date   |
|------------|---------------------|
| London     | 1st Jan             |
| London     | 2nd Jan             |
| New Delhi  | 2nd Jan             |

Запрос на получение даты последнего обновления

  • заставляет S3 сканировать все 3 записи
  • но возвращенных записей всего 2 (когда последняя обновленная дата - 2 января)

Запрос на выбор города, дата последнего обновления которого - 1 января,

  • просканирует все 3 строки
  • но верните только 1 строку - «Нью-Дели».

Следовательно, в зависимости от вашего запроса он может сканировать больше данных (3 строки), но возвращать меньше данных (2 строки).

Надеюсь, теперь вы понимаете разницу между отсканированными и возвращенными данными.

Другие вопросы по теме