Сравнение OCR под линукс

0

0

Во время очередного спора «Cuneiform & Tesseract vs Finereader и всё остальное» захотелось не быть голословным, и померить, которая из программ всё-таки лучше.

Взял главу из «3 мушкетёров» на английском, загнал в GIMP, сохранил как PNG, распознал. Результат сравнил с оригиналом. Размер главы — 2574 слов, 14869 знаков. Результаты — в таблицах.

Кстати, как правильно перевести «bearing y»? Это означает высоту строчных букв без хвостов: a, c, e, m, n, o, r, s, u, v, w, x, z.

Bearing Y=10

Программа       время,с слов    символов
FineReader 8    40      298     304	
ReadIris 7      13      1881    4576	
ReadIris 12     17      32      38	
Asprise         29,2    1291    2451	
GOCR            213,5   1916    3769	
OCRAD           2,4     2565    10032	
CuneiForm       6,3     759     1357	
Tesseract       18,5    26      32

Bearing Y=20

Программа       время   слов    символов
FineReader 8    35      1       2
ReadIris 7      14      211     273
ReadIris 12     25      135     162
Asprise         36,7    332     390
GOCR            194,7   743     1308
OCRAD           3,8     690     1009
CuneiForm       9,7     43      27
Tesseract       16,7    57      58

Bearing Y=30

Программа       время   слов    символов
FineReader 8    42      21      21	
ReadIris 7      19      406     588	
ReadIris 12     45      218     331	 
Asprise         37,3    310     355	
GOCR            257,9   317     362	 
OCRAD           6,9     1593    2407	 
CuneiForm       18,2    44      53	
Tesseract       22,3    4       3

Вот такие пока результаты. Какие ещё программы стоит добавить в список (пока ковыряю ocre)? Как лучше имитировать грязь и повреждения для приближения условий тестов к реальным? Или у кого-нибудь найдутся сканы в нескольких разрешениях с заведомо правильно распознанным текстом?

Немного более подробная информация о тестах — на странице http://vopros4.livejournal.com/1078.html

Ссылка

←	Почему кошки любят созерцать?

[жж]Куклачев. тссс

→

файнридер под линух есть?
И не понятны результаты: что указывается в таблице?

eugene2k ★
(09.12.09 14:42:27 MSK)

Ну со временем понятно: чем меньше - тем лучше. А что со словами и символами? Это число неправильно распознанных слов? То есть чем меньше - тем лучше?

Evgueni ★★★★★
(09.12.09 14:48:00 MSK)

Ответ на: комментарий от eugene2k 09.12.09 14:42:27 MSK

> файнридер под линух есть?

Первые 3 пункта — под вайном. Известные коммерческие программы, для сравнения.

что указывается в таблице?

Время распознавания, число неправильно распознанных слов, число неправильно распознанных букв.

При этом если буква при распознавании распалась на две, считается за одну, а если 2 слились, считаются за 2.

question4 ★★★★★
(09.12.09 14:48:47 MSK) автор топика

Ссылка

Ответ на: комментарий от Evgueni 09.12.09 14:48:00 MSK

> А что со словами и символами? Это число неправильно распознанных слов? То есть чем меньше - тем лучше?

Да.

question4 ★★★★★
(09.12.09 14:49:06 MSK) автор топика

А почему текст именно на английском?

Anounax ★
(09.12.09 14:52:44 MSK)

Ссылка

Ответ на: комментарий от question4 09.12.09 14:49:06 MSK

Ну тогда CuneiForm и Tessaract вполне достойно выглядят. IMHO с русским языком тоже самое было бы интересно глянуть. Правда число участников в этом случае сильно уменьшится.

Evgueni ★★★★★
(09.12.09 14:53:08 MSK)

Ответ на: комментарий от Evgueni 09.12.09 14:53:08 MSK

Ах да забыл добавить: теперь это оформить как статью (с русским обязательно) и послать в Linux Format. Могу указать направление :)

P.S. Правда в этом случае остаётся вопрос с лицензионностью используемых коммерческих программ (если для всех можно добыть демо для целей тестов было бы здорово).

Evgueni ★★★★★
(09.12.09 14:55:49 MSK)

Ответ на: комментарий от Evgueni 09.12.09 14:55:49 MSK

> Ну тогда CuneiForm и Tessaract вполне достойно выглядят. IMHO с русским языком тоже самое было бы интересно глянуть.

Обязательно.

Правда число участников в этом случае сильно уменьшится.

Отсеются Gocr и Ocrad. Хотя опасаюсь, что Tesseract даст 100% неверных слов :)

Какие ещё есть программы хотя бы с бесплатными демо-версиями?

Ах да забыл добавить: теперь это оформить как статью (с русским обязательно) и послать в Linux Format. Могу указать направление :)

Спасибо. Воспользуюсь предложением, когда сделаю для русского языка и на «грязной» бумаге. Вопрос как сделать второе...

P.S. Правда в этом случае остаётся вопрос с лицензионностью используемых коммерческих программ (если для всех можно добыть демо для целей тестов было бы здорово).

Не без этого :) Не уверен, позволяет ли демо-версия Файнридера сохранять файлы. Не найдётся ди на ЛОРе человека, который предоставит для опытов свой лицензионный файнридер? Там нужно всего лишь загрузить файл, нажать на кнопку «распознать» и сохранить его в UTF.

И я не уверен, есть ли русский в демо-версии ReadIris, но английский в 11-й точно есть. А 7-я в таблице и есть триальная, правда старовата — 2002 год.

question4 ★★★★★
(09.12.09 15:20:32 MSK) автор топика

Ответ на: комментарий от question4 09.12.09 15:20:32 MSK

> Не уверен, позволяет ли демо-версия Файнридера сохранять файлы.

А почему бы не написать в сами фирмы? Описать ситуацию, тест и попросить содействие? Я как-то для потенциального обзора выпросил ключик для Bricscad, но к сожалению был сильно им разочарован.

P.S. Если кто-то отказался или не отреагировал, то это тоже информационный повод. :) Ну и как вариант действительно найти кого-нибудь с лицензионной версией и прогнать тест вполне рабочий.

Evgueni ★★★★★
(09.12.09 16:01:54 MSK)

Ответ на: комментарий от Evgueni 09.12.09 16:01:54 MSK

> А почему бы не написать в сами фирмы? Описать ситуацию, тест и попросить содействие?

Сомневаюсь, что они ABBYY дадут 8-ю версию с ключом кому бы то ни было. Насчёт их движка под линукс — не знаю, могут и дать, но по ряду причин уверен, что конкретно мне не дадут. Долгая история :)

Зато триальная 10-я, оказывается, умеет сохранять. Правда, не более 1 страницы, но мне столько и нужно. Качаю. Надеюсь, под вайном заведётся.

question4 ★★★★★
(09.12.09 16:28:04 MSK) автор топика

Спасибо за тест.

Очень интересно как поведет себя FR10 под wine.

praseodim ★★★★★
(09.12.09 16:45:23 MSK)

Ссылка

Ответ на: комментарий от question4 09.12.09 16:28:04 MSK

Для моих задач хватает четвертого файнридера-спринт. Со сканером достался.

abraziv_whiskey ★★★★★
(09.12.09 17:23:35 MSK)

Ссылка

Ответ на: комментарий от question4 09.12.09 16:28:04 MSK

> Сомневаюсь, что они ABBYY дадут 8-ю версию с ключом кому бы то ни было. Насчёт их движка под линукс — не знаю, могут и дать, но по ряду причин уверен, что конкретно мне не дадут. Долгая история :)

Можно попросить их потестировать и отослать примеры своих сканов. Дело конечно долгое - пока доберёшься до нужно человека, но IMHO попытка - не пытка.

Evgueni ★★★★★
(09.12.09 17:32:55 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Почему кошки любят созерцать?

Talks

[жж]Куклачев. тссс

→

Похожие темы