Я пытаюсь использовать пользовательские шаблоны tesseract с pytesseract, но не могу заставить команду работать. Кажется, это должно быть довольно просто, но документация скудна.
Я на тессеракте 3.05.01. Это не сработает:
pytesseract.image_to_string(image, config='--oem 0 bazaar --user-patterns ./timestamps.user_patterns')
У меня есть базарный файл в /usr/local/share/tessdata/configs/bazaar, в котором написано следующее:
load_system_dawg T
load_freq_dawg T
user_words_suffix user-words
user_patterns_suffix user-patterns
Я пытаюсь определить 4 числа, поэтому мой файл пользовательских шаблонов:
\d\d\d\d
Я получаю следующую ошибку:
pytesseract.pytesseract.TesseractError: (1, "read_params_file: Can't open -user-patterns read_params_file: parameter not found: \\d\\d\\d\\d")






Удалите ваш параметр
--user-patterns ./timestamps.user_patternsиз команды. Tesseract найдет ваши пользовательские шаблоны из вашей конфигурации базара. Обратите внимание, что с выбранным вами наименованием - ожидается, что вы будете использовать языкtimestamps(и тот же файл обученных данных). Также обратите внимание, что очень маловероятно, что файл шаблонов будет делать то, что вы ожидаете, и, вероятно, проще добавить вместо этого какой-либо этап постобработки.