Я пытаюсь выполнить определенные операции постобработки на выходе ocr из Tesseract в Python, используя модуль Pytesseract, для которого требуется информация о размере шрифта слова. Я знаю, что информацию о размере шрифта можно получить с помощью Tesseract, потому что Tesseract.js предоставляет такую информацию (например, размер шрифта Word, выбор всех отдельных символов с соответствующими значениями достоверности) в выводе ocr, но я не знаю, как получить то же самое с привязкой tesseract в Python. Есть ли какая-либо другая привязка python для tesseract lib для получения такой информации?
Спасибо @DmitriiZ. для ответа я знаю об этой функции, но я не могу вызвать эту функцию из Python.
Похоже, это поддерживается оберткой это
Да, он предоставляет итератор выбора github.com/sirfz/…
Если это поможет - функция WordFontAttributes, которая предоставляет размер шрифта, расположена здесь, но я не знаю ни одной оболочки Python, которая тоже поддерживает это.