На странице цен Amazon указано, что для US-east-1 в Огайо цена составляет 5 центов за страницу анализа документов с формами. (https://aws.amazon.com/texttract/pricing/)
Мне интересно, как измеряется страница - например, если изображения формы обрезаются и помещаются в один PDF вместе, будет ли это по-прежнему составлять одну страницу?
Кроме того, я знаю, что Texttract также обрабатывает изображения. Как создаются страницы изображений в Texttract?
Будет ли механизмом экономии затрат включать столько текста, сколько необходимо для анализа, на одну страницу PDF, даже если это может немного снизить точность?
Нашей компании требуется обработка более миллиона бумажных форм, это буквально разница между счетом в 5000 долларов в месяц и счетом в 200 000 тысяч долларов в месяц на Amazon. Таким образом, прямо сейчас мы вынуждены использовать DocumentDetection по 0,1 цента за страницу, но мы хотели бы использовать анализ данных формы/таблицы, который в настоящее время стоит 6 центов за страницу.
На их странице с ценами, которую вы связали, они говорят
Одна страница может содержать от 0 до 3000 слов.
Так что, я думаю, пока вы упаковываете все необходимые элементы <3000 слов на одну страницу, вам будет выставлен счет за одну страницу.