OCR и pytesseract обнаруживают числа на изображении

currentbid.png:

OCR и pytesseract обнаруживают числа на изображении

Я пытаюсь определить число на этом изображении, но оно выдает буквы или неправильный номер.

Это мое изображение, я пытаюсь определить число, я пробовал массу вещей с оттенками серого и инверсией, используя тессеракт, но, кажется, ничего не работает, оно продолжает выдавать мне буквы, такие как ADA, или неправильный номер, например, если бы на изображении было написано 98,7M, это дало бы мне 19 9947 )М и я думаю, что точка испортилась, но я не могу удалить ее или изменить шрифт. Как я могу это исправить или обучить?

Вот мой текущий код:

pyautogui.screenshot("bidpossible.png", region=(900, 310, 450, 60)) #bidpossible
originalImage = cv2.imread('bidpossible.png')


grayImage = cv2.cvtColor(originalImage, cv2.COLOR_BGR2GRAY)

(_, blackAndWhiteImage) = cv2.threshold(grayImage, 127, 255, cv2.THRESH_BINARY_INV)

custom_config = r'--psm 8'


text = pytesseract.image_to_string(blackAndWhiteImage, config=custom_config)
print('Extracted Text: ', text)
Почему в Python есть оператор "pass"?
Почему в Python есть оператор "pass"?
Оператор pass в Python - это простая концепция, которую могут быстро освоить даже новички без опыта программирования.
Некоторые методы, о которых вы не знали, что они существуют в Python
Некоторые методы, о которых вы не знали, что они существуют в Python
Python - самый известный и самый простой в изучении язык в наши дни. Имея широкий спектр применения в области машинного обучения, Data Science,...
Основы Python Часть I
Основы Python Часть I
Вы когда-нибудь задумывались, почему в программах на Python вы видите приведенный ниже код?
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
LeetCode - 1579. Удаление максимального числа ребер для сохранения полной проходимости графа
Алиса и Боб имеют неориентированный граф из n узлов и трех типов ребер:
Оптимизация кода с помощью тернарного оператора Python
Оптимизация кода с помощью тернарного оператора Python
И последнее, что мы хотели бы показать вам, прежде чем двигаться дальше, это
Советы по эффективной веб-разработке с помощью Python
Советы по эффективной веб-разработке с помощью Python
Как веб-разработчик, Python может стать мощным инструментом для создания эффективных и масштабируемых веб-приложений.
0
0
56
1
Перейти к ответу Данный вопрос помечен как решенный

Ответы 1

Ответ принят как подходящий

как насчет использования фильтра, который попытается получить только голубой цвет, находящийся внутри границы текста?


grayImage[(grayImage<210)] = 255
grayImage[(grayImage>210) & (grayImage<230)] = 0


# test different models, imho models 6 or 7 work better
custom_config = f'--psm 7' 
text = pytesseract.image_to_string(grayImage, config=custom_config)
print(f'Extracted Text: ', text) # 4.34m_

Спасибо, но теперь у меня также возникли проблемы с обнаружением белого текста с черным контуром на белом фоне, он выдает что-то близкое к слову. Поэтому я попробовал список слов, чтобы определить, какое слово ближе всего к нему. Это иногда работает, но ненадежно. Как я могу читать это лучше?

philM 13.06.2024 16:13

Не могли бы вы добавить к вопросу новую картинку? Дайте мне знать, если он сложнее первого.

Johnny Cheesecutter 13.06.2024 20:47

Честно говоря, tessarect — не лучший вариант для сложных задач по распознаванию текста. Возможно, имеет смысл переключиться на нейронные сети, например, на библиотеку mocr: github.com/open-mmlab/mmocr/tree/main?tab=readme-ov-file

Johnny Cheesecutter 13.06.2024 20:49

Другие вопросы по теме