Мы используем API Google Cloud Vision для извлечения полей счета. Мы хотели бы знать, поддерживают ли API обнаружение таблицы данных? Или нам нужно написать собственный код для обнаружения таблиц?
API Google Vision не будет возвращать данные из форм в структурированном виде. Однако координаты многоугольников, окружающих текст (boundingPoly), будут предоставлены в ответе. Взгляните на этот пример:
{
"description": "ABBEY",
"boundingPoly": {
"vertices": [ {
"x": 44,
"y": 43
}, ...
] }, ...
}
Один из подходов, который вы можете использовать, - это определить координаты поля в вашем счете-фактуре, а затем написать код для итерации по объектам boundingPoly вашего ответа JSON, чтобы проверить, перекрывается ли область, в которой находятся вершины, до некоторой степени с областью вашего поля. Если координаты boundingPoly находятся в том же регионе, что и ваши поля, то - например, с помощью Python - вы можете сопоставить эти слова, используя словарь, с именами ваших полей.