Оптическое распознавание шрифта Брайля с использованием OpenCV

На самом деле я пытаюсь распознать в документе символы Брайля. Я собираюсь преобразовать документ Брайля в обычный текст. Я использую OpenCV с Java для обработки изображений.

Сначала я импортировал изображение документа Брайля:

Затем я обработал изображение, чтобы преобразовать исходное изображение в двоичную форму. Я прочитал, что важными шагами являются:

Преобразуйте изображение в уровни серого
Уменьшить шум
Увеличьте контрастность краев
Бинаризуйте изображение

Вот код, который я использовал:

public static void main(String args[]) {

    Mat imgGrayscale = new Mat();

    Mat image = Imgcodecs.imread("C:/Users/original_braille.jpg", 1);  


    Imgproc.cvtColor(image, imgGrayscale, Imgproc.COLOR_BGR2GRAY);

    Imgproc.GaussianBlur(imgGrayscale, imgGrayscale, new Size(3, 3), 0);
    Imgproc.adaptiveThreshold(imgGrayscale, imgGrayscale, 255, Imgproc.ADAPTIVE_THRESH_MEAN_C, Imgproc.THRESH_BINARY_INV, 5, 4);

    Imgproc.medianBlur(imgGrayscale, imgGrayscale, 3);
    Imgproc.threshold(imgGrayscale, imgGrayscale, 0, 255, Imgproc.THRESH_OTSU);

    Imgproc.GaussianBlur(imgGrayscale, imgGrayscale, new Size(3, 3), 0);
    Imgproc.threshold(imgGrayscale, imgGrayscale, 0, 255, Imgproc.THRESH_OTSU);

    Imgcodecs.imwrite( "C:/Users/Jean-Baptiste/Desktop/Reconnaissance_de_formes/result.jpg", imgGrayscale );

}

На этом шаге я получил следующий результат:

Оптическое распознавание шрифта Брайля с использованием OpenCV

По моему мнению, мы можем улучшить качество этого изображения для получения лучших результатов, но у меня нет опыта работы с различными методами обработки изображений. Могу ли я улучшить качество своих фильтров?

После этого я хотел бы выполнить сегментацию изображения, чтобы обнаружить различные символы этого документа. Я хотел бы разделить разные символы документа, чтобы преобразовать их в текст.

Например, я нарисовал разделительные линии документа вручную:

Оптическое распознавание шрифта Брайля с использованием OpenCV

Но я не нашел решения для этого шага. Есть ли возможность сделать то же самое с OpenCV?

Для поиска точек на изображении вы можете почерпнуть идеи отсюда: docs.opencv.org/3.3.1/d3/db4/tutorial_py_watershed.html

— 04.06.2018 17:10

И чтобы найти разделительные линии, если ваш документ правильно сформирован (т.е. даже интервал между строками), вы можете сделать что-то вроде: 1 - получить средний размер точки s с первого прохода 2 - получить группу строк размером s / 2 для которых нет пересечения с точками 3 - рекурсивно объединить те, которые находятся рядом друг с другом

— 04.06.2018 17:16

Привет спасибо за ответ

— 05.06.2018 08:47

Постараюсь реализовать такой подход. Я не очень опытен, но надеюсь, что справлюсь.

— 05.06.2018 08:55

java opencv image-processing ocr image-segmentation

04.06.2018 16:45

Пользовательский скаляр GraphQL

Листовые узлы системы типов GraphQL называются скалярами. Достигнув скалярного типа, невозможно спуститься дальше по иерархии типов. Скалярный тип...

Как вычислять биты и понимать побитовые операторы в Java - объяснение с примерами

В компьютерном программировании биты играют важнейшую роль в представлении и манипулировании данными на двоичном уровне. Побитовые операции...

Поднятие тревоги для долго выполняющихся методов в Spring Boot

Приходилось ли вам сталкиваться с требованиями, в которых вас могли попросить поднять тревогу или выдать ошибку, когда метод Java занимает больше...

Принятие принципов SOLID в Spring Boot: Создание обслуживаемых и масштабируемых приложений

Коллекции (ArrayList , HashSet , HashMap)

Полный курс Java для разработчиков веб-сайтов и приложений

Получите сертификат Java Web и Application Developer, используя наш курс.

1 754

Ответы 1

Вот небольшой скрипт, который находит линии на вашем изображении. Это на python, у меня нет установленной java-версии openCV, но я думаю, что вы все равно можете получить представление об алгоритме.

Найти вертикальные линии не так просто, потому что расстояние между точками зависит от букв, следующих друг за другом. Вероятно, вы могли бы попробовать алгоритмы сопоставления шаблонов с некоторыми общими буквами. Учитывая тот факт, что на этом этапе вы знаете высоту букв, это не должно быть слишком сложно.

Конечно, весь этот подход предполагает, что документ не поворачивается.

import numpy as np
import cv2

# This is just the transposition of your code in python
img      = cv2.imread('L1ZzA.jpg')
gray     = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
blur     = cv2.GaussianBlur(gray,(3,3),0)
thres    = cv2.adaptiveThreshold(blur,255,cv2.ADAPTIVE_THRESH_MEAN_C,cv2.THRESH_BINARY,5,4)
blur2    = cv2.medianBlur(thres,3)
ret2,th2 = cv2.threshold(blur2,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
blur3    = cv2.GaussianBlur(th2,(3,3),0)
ret3,th3 = cv2.threshold(blur3,0,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)

# Find connected components and extract the mean height and width
output = cv2.connectedComponentsWithStats(255-th3, 6, cv2.CV_8U)
mean_h = np.mean(output[2][:,cv2.CC_STAT_HEIGHT])
mean_w = np.mean(output[2][:,cv2.CC_STAT_WIDTH])

# Find empty rows, defined as having less than mean_h/2 pixels
empty_rows = []
for i in range(th3.shape[0]):
  if np.sum(255-th3[i,:]) < mean_h/2.0:
    empty_rows.append(i)           

# Group rows by labels
d = np.ediff1d(empty_rows, to_begin=1)

good_rows   = []
good_labels = []
label       = 0

# 1: assign labels to each row
# based on whether they are following each other or not (i.e. diff >1)
for i in range(1,len(empty_rows)-1):
  if d[i+1] == 1:
    good_labels.append(label)
    good_rows.append(empty_rows[i])

  elif d[i] > 1 and d[i+1] > 1:
    label = good_labels[len(good_labels)-1] + 1

# 2: find the mean row value associated with each label, and color that line in green in the original image
for i in range(label):
  frow = np.mean(np.asarray(good_rows)[np.where(np.asarray(good_labels) == i)])
  img[int(frow),:,1] = 255 

# Display the image with the green rows
cv2.imshow('test',img)
cv2.waitKey(0)

06.06.2018 09:54

Другие вопросы по теме

Устранение ложных срабатываний, обнаруженных OpenCV EM

Обработка видео в реальном времени в android? как в Google I / O 2018. с openCV какая частота кадров достижима>

Многопоточное чтение данных

Обнаружение строки Python

Преобразование массива Numpy в изображение с помощью CV2 или PIL

NamedWindow отображается, но не работает

Как объединить серый и rgb-канал изображения с помощью Python

Удалить пиксель со значением 0 255 в массиве np

Связывание ошибок на Android с OpenCV 3.4.0 и NDK

Самый эффективный способ отправить изображение в YUV_420_888 с Android на JNI в OpenCV Mat

Оптическое распознавание шрифта Брайля с использованием OpenCV

Ответы 1

Другие вопросы по теме

Похожие вопросы