История изменений

Исправление peregrine, 04.12.22 15:06 (текущая версия) :

Процесс распознавания более-менее адекватный выглядит следующим образом (упрощённо)

0) Предобработка изображения (баланс белого и т.д., исправление смазанности и размытости и т.д., тут даже нейронкам есть где разгуляться)

1) Определение блоков (текст, таблицы, изображения)

2) Определение направления текста

3) Сегментация текста по строкам

4) Сегментация текста по предположительным буквам

5) Обработка изображения (разрешение, резкость, цвета и т.д.)

5) Распознавание текста

Если мы будем определять блоки где-то ещё, то по очевидным для меня причинам (данные статистически будут отличаться от тех, на которых проводилось обучение алгоритмов), точность распознавания будет падать.

Тессеракт, же, про половину этих этапов ничего не знает, а вторую половину умеет на основе алгоритмов которые были передовыми в 1995 году. Т.е. 30 лет теории прошли мимо него.

Исходная версия peregrine, 04.12.22 15:06:

Процесс распознавания более-менее адекватный выглядит следующим образом (упрощённо)

0) Предобработка изображения (баланс белого и т.д., исправление смазанности и размытости и т.д., тут даже нейронкам есть где разгуляться) 1) Определение блоков (текст, таблицы, изображения) 2) Определение направления текста 3) Сегментация текста по строкам 4) Сегментация текста по предположительным буквам 5) Обработка изображения (разрешение, резкость, цвета и т.д.) 5) Распознавание текста