Я работаю над приложением среднего размера с рядом функций. Я уже сделал большую часть частей. Я просто оставил часть Text Recognition + OMR для системы посещаемости. Может ли кто-нибудь дать мне какое-то направление (документация или учебник, которым я могу следовать) по технологии Android Text Recognition + OMR (работающей вместе) и шагам по реализации моей функции? Я буду вам бесконечно благодарен за эту помощь.
У меня есть ряд функций, не связанных с этой, поэтому я не хотел их публиковать. Что мне нужно сделать, так это после того, как я сфотографировал лист посещаемости (с маркером, номером списка и пузырем), мое приложение должно сопоставить номер ролика с базой данных Firebase. Затем, если пузырь заполнен, он должен вставить значение «Настоящее» (Firebase), а если пузырь не заполнен, он вставит «Отсутствует» в поле посещаемости конкретного номера ролика в базе данных.




¿Всегда ли изображение имеет одинаковые размеры и ответы тоже находятся в одном и том же положении?
Если ответ положительный, вы можете обрезать каждый ответ, а затем разделить столбцы «Нет списка» и «Посещаемость» на двух отдельных изображениях.
Вы можете использовать OpenCV, чтобы сделать это: Как обрезать изображение в OpenCV с помощью Python
Затем вы можете использовать OCR с номером рулона. изображение (например, Тессеракт) и с помощью круга вы можете увидеть, является ли центральный пиксель круга черным или белым.
Если ответы всегда начинаются с одной и той же позиции (x, y), занимают один и тот же размер и т. д. Если вы можете предположить это, вы можете обрезать ответы, потому что вы знаете, где они находятся. OpenCV имеет дистрибутив java. У них есть отличный учебник о том, как установить и использовать это в eclipse: docs.opencv.org/2.4/doc/tutorials/introduction/java_eclipse/… Tesseract тоже находится в java. Он называется Tess4j. Вы можете скачать в sourceforce: tess4j.sourceforge.net
еще раз спасибо. я попробую это. хотя я создаю свое приложение в студии Android ..
Вы также можете использовать OpenCV и Tessereact в Android: Tesseract для Android: github.com/rebbix/tesseract-android-tools/tree/master/… OpenCV для Android: opencv.org/platforms/android
Поскольку вы не упомянули, что OCR должно выполняться внутри кода приложения, вы можете использовать AWS Rekognition со своим приложением Android. Вот несколько ссылок, с которых можно начать:
Ваш рабочий процесс будет таким:
спасибо .. но поскольку у моего пользователя нет доступа в Интернет, я хочу, чтобы все выполнялось локально. если я не могу этого сделать, я последую вашему совету. Я очень благодарен за ваш ответ с поучительным объяснением.
Спасибо за ваш ответ. Я должен использовать java, чтобы реализовать это (если вы предоставите некоторую ссылку на java). поскольку будет очень много пользователей. Я думаю, что я поставлю рамку в действие камеры, чтобы пользователь мог выровнять бумагу внутри коробки. Будет ли это означать "то же измерение", как вы спрашиваете ..?