может все таки сделаем OCR?

Можешь уже начинать - я согласен что некоторым людям оно очень нужно, но большинству оно нафик не впилось

Orlangoor ★★★★★
(28.11.06 10:43:14 MSK)

syomin занимается OCR:
http://www.linux.org.ru/jump-message.jsp?msgid=1625045#1635983
Почему бы тебе не присоединиться к нему?

~~geekkoo~~ ★
(28.11.06 10:50:11 MSK)

Ссылка

Ответ на: комментарий от Orlangoor 28.11.06 10:43:14 MSK

спасибо за благославение, без него ну никуда.
мне оно тоже особо не надо, все равно многие всякую херню сами ваяют в свободное время, просто из интереса, так почему бы не заняться OCR.

divenvrsk ★
(28.11.06 10:52:57 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 10:52:57 MSK

я не вижу смысла писать свой движок, ибо даже вдесятером мы за год не напишем даже тот же открытый google`овский.
я думаю проще разобрать по запчастям то что есть.

divenvrsk ★
(28.11.06 10:58:51 MSK) автор топика

Ссылка

давайте лучше звиздалет сделаем! И улетим далеко на йух, обоснуемся на какой-нибудь планетке и воздвигнем город с гордым именем Опенсорбург!

:)

geek ★★★
(28.11.06 11:01:21 MSK)

Ответ на: комментарий от geek 28.11.06 11:01:21 MSK

я тут как раз поспорил с человеком через сколько постов начнется= :)

divenvrsk ★
(28.11.06 11:02:54 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 11:02:54 MSK

лучший OCR - толпа студентов

Ex ★★
(28.11.06 11:15:53 MSK)

Ссылка

Ответ на: комментарий от divenvrsk 28.11.06 10:52:57 MSK

> мне оно тоже особо не надо, все равно многие всякую херню сами ваяют в свободное время, просто из интереса, так почему бы не заняться OCR.

если вам не нужен результат вашей работы можете даже не приступать - провалитесь 101%. а если совсем уж делать нечего.. кот и тот сообразительнее и от действий наблюдается хоть какая-то польза.

// wbr

~~klalafuda~~ ★☆☆
(28.11.06 11:21:56 MSK)

Ответ на: комментарий от klalafuda 28.11.06 11:21:56 MSK

хрен с трамвайной ручкой не надо путать.
результат всего за что я берусь мне важен, фраза касалась того, что мне в повседневной жизни нет надобности в подобном софте.

divenvrsk ★
(28.11.06 11:30:05 MSK) автор топика

Ссылка

те кто может написать OCR он нафиг не нужен, тем кому он нужен его написать не могут.

Там много гемора, и в основном гуй, просто так писать никто не станет ибр лень да и неинтерестно.

alphex_kaanoken ★★★
(28.11.06 12:19:57 MSK)

Ответ на: комментарий от alphex_kaanoken 28.11.06 12:19:57 MSK

> те кто может написать OCR

В холостую работать не будут бо проект сам по себе не на один десяток тонн тянет.

> Там много гемора, и в основном гуй

80 данунах а не персептроника ?

iBliss ★
(28.11.06 12:23:42 MSK)

Ответ на: комментарий от iBliss 28.11.06 12:23:42 MSK

>80 данунах а не персептроника ?

нихрена ты перцептронами не распознаешь за приемлемое время

geek ★★★
(28.11.06 12:27:24 MSK)

Ответ на: комментарий от iBliss 28.11.06 12:23:42 MSK

>80 данунах а не персептроника ?

реально, алгоритмы уже есть, и были даже где то вполне готовые и рабочие, ибо это еще интерестно, кажется немецкие студенты что то там приличное забахали, но вот дальше забили, что делать поддержку других языков, что писать гуй - ибо неинтерестно.

alphex_kaanoken ★★★
(28.11.06 12:31:00 MSK)

Ответ на: комментарий от geek 28.11.06 12:27:24 MSK

> нихрена ты перцептронами не распознаешь за приемлемое время.

Первое что в голову пришло. Но один хрен тема далеко не для "сел я значит вечером после ужина децл покодить..."

iBliss ★
(28.11.06 12:57:51 MSK)

Ссылка

Ответ на: комментарий от alphex_kaanoken 28.11.06 12:31:00 MSK

> кажется немецкие студенты что то там приличное забахали, но вот дальше забили, что делать поддержку других языков

Так поддержка других языков это и есть распознавание образов а не строго известного набора символов.

iBliss ★
(28.11.06 13:00:19 MSK)

Ответ на: комментарий от iBliss 28.11.06 13:00:19 MSK

>Так поддержка других языков это и есть распознавание образов а не строго известного набора символов.

ты слышал про omni font ?

alphex_kaanoken ★★★
(28.11.06 14:24:48 MSK)

Ответ на: комментарий от iBliss 28.11.06 13:00:19 MSK

>Так поддержка других языков это и есть распознавание образов а не строго известного набора символов.

вменяемая ocr немыслима без спеллчекера как минимум. А вообще желательно ещё и контекстный анализ прикрутить :)

geek ★★★
(28.11.06 14:37:01 MSK)

Ссылка

Ответ на: комментарий от alphex_kaanoken 28.11.06 14:24:48 MSK

> ты слышал про omni font ?

Не самый удачная идея...

شيطان

Это под него не попадет стопудово - ибо символы композитные

iBliss ★
(28.11.06 14:43:46 MSK)

Ссылка

http://jocr.sourceforge.net/

http://www.gnu.org/software/ocrad/ocrad.html

Neksys ★★★
(28.11.06 15:49:55 MSK)

Ответ на: комментарий от geek 28.11.06 12:27:24 MSK

Почему ты так думаешь? Если юзать уже хорошо надроченную madaline-сеть, например

swizard ★
(28.11.06 15:51:27 MSK)

Ответ на: комментарий от Neksys 28.11.06 15:49:55 MSK

> http://jocr.sourceforge.net/

Помню года 2 назад пробовал эту штуку для интереса - скриншот текстового файла (т.е идеальный случай) разпознавал вполне нормально. По поводу самого проекта - там щас есть утилита как отдельный исполняемый файл jocr, и libjorc - это попытка вынести функциональность из экзешника в либу с грамотно спроектированным интерфейсом (для программирования) - т.е чтобы можно было писать к ней плагины для разных языков/шрифтов и разные бэкенды. Судя по дате последнего обновления (2001 год) libjocr загнулась:

http://jocr.sourceforge.net/api/

Если кто собирается этим заниматься, по-моему имеет смысл связаться с разработчиком, узнать как там дела с libjocr (может быть он над ней все еще работает, только сайт не обновляет - вон сам gocr в августе этого года обновлял) - и если она сейчас в человеческом состоянии, то писать плагин для русского языка под эту либу. Думаю начать будет не очень сложно - можно взять за основу наработки для английского алфавита и дополнить новыми. И еще не нужно пытаться делать 2 дела одновременно - или разрабатывать гуй, или заниматься проблемой распознавания - одно из двух для одного человека - иначе просто распылишь все силы и ничего не получится.

А вообще созывать народ просто так особого прока нету - если есть время - начинай сам, создай основу, опубликуй и обозначь направления в которых нужно работать/нужна помощь - у кого есть желание присоединится.

bender ★★★★★
(28.11.06 17:16:38 MSK)

Ответ на: комментарий от bender 28.11.06 17:16:38 MSK

По поводу гуя - помнится LinFan (который постит скриншоты со своим векторным редактором sk1) заикался про то, что ему нужен какой-то ocr-движок - мне кажется векторный редактор вполне может подойти для выделения фрагментов текста на отсканированной книжке. Так что если LinFan этим займется, а он судя по всему щас очень активно воплощает все свои идеи, то хоть какой-то гуй для распознавания полюбому будет - нужен только движок, который бы понимал русский язык.

bender ★★★★★
(28.11.06 17:23:12 MSK)

Ссылка

Ответ на: комментарий от Neksys 28.11.06 15:49:55 MSK

По поводу качества распознования - для начала неплохо бы поиметь фреймворк со общепринятым интерфейсом подключения всевозможных плагинов и с одним дефолтным плагином который хоть как-то распознает текст - тогда можно будет делать человеческий гуй, который все это будет поддерживать, а сами плагины подтянутся (с разными алгоритмами лучшего или худшего качества) - тогда специалист в ocr не будет париться над приделыванием гуя к его либе, а будет для тестирования иметь под рукой нормальное приложение, в котором сразу сможет потестить свой новый алгоритм.

bender ★★★★★
(28.11.06 17:29:28 MSK)

Ссылка

Ответ на: комментарий от swizard 28.11.06 15:51:27 MSK

>Почему ты так думаешь?

да потому что некорректно распознанный символ не обязательно приведет к некорректному с точки зрения орфографии слову :)

geek ★★★
(28.11.06 17:40:04 MSK)

Ссылка

Ответ на: комментарий от bender 28.11.06 17:16:38 MSK

>то писать плагин для русского языка под эту либу.

гокр написан через жопу. Там анализ буковок захардкожен - для каждого символа написана своя тест-функция. Да, там есть возможность включить модуль, который типа по базе данных признаков распознает, и обучить кириллическим глифам...вот только этот модуль вообще нихера не работает.

geek ★★★
(28.11.06 17:42:02 MSK)

Ответ на: комментарий от geek 28.11.06 17:42:02 MSK

вроде бы отозвалось некоторое количество лич причастных к OCR.
о результатах будет доложено в установленной форме.
заово движок никто писать не собирается, будет строить на том, что есть, понятное дело что гуи прийдется строить нормальный, т.к. писать модуль анализа (картинка, пятно от кофе, дырка от сигареты, текст) пока не планируется.

divenvrsk ★
(28.11.06 20:00:54 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 20:00:54 MSK

>т.к. писать модуль анализа (картинка, пятно от кофе, дырка от сигареты, текст) пока не планируется.

а без этого смысл пропадает. Потому что если написать движок, анализирующий простой ч/б текст без таблиц и картинок легко, то добавить потом к нему определятор (слово-то какое придумал) - нереально. Нужно будет переписывать само ядро ;)

geek ★★★
(28.11.06 20:10:22 MSK)

Ответ на: комментарий от geek 28.11.06 20:10:22 MSK

определились движок делать модульным, синтаксис сохраним, а модули по анализу и определению контента - потом. ибо вначале хочется посмотреть будет ли он вообще нормально распознавать и имеет ли смысл тогда уже писать все остальное.

divenvrsk ★
(28.11.06 20:34:11 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 20:34:11 MSK

>а модули по анализу и определению контента - потом.

*потом* придется весь движок переделывать. Это комплексная задача и очень хреново делится на этапы

geek ★★★
(28.11.06 20:44:53 MSK)

Ответ на: комментарий от geek 28.11.06 20:44:53 MSK

алгоритм -
1. анализ изображения и деление его на блоки (view_this.cpp) (текст, графика, всякая херня);
2. берем тот блок что текст и отправляем на распознование.
.... и так далее.
100.

причем здесь трудности движка? мы хотим попробовать модуль распознавания - будет он распознавать или будет гамлета писать из отсканированной отцы и дети.

divenvrsk ★
(28.11.06 20:50:32 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 20:50:32 MSK

элементарное деление на буковки ч/б изображение, масштабирование к паттерну и сопоставление дает 30-40% -ую точность :) При использовании более умных паттернов (где каждому элементу соответствует вес) повышает точность до 50%. Но я особо с весами не заморачивался. Это на факсе хорошего качества без таблиц и картинок и без обработки форматирования - т.е. на выходе поток символов (включая пробелы и переводы строки).

Лучшее качество дает распознавание формы символа - алгоритм достаточно простой, но требует проработки на предмет разрывов. Но! все эти алгоритмы требуют точного отделения глифа от фона. Вот тут и начинаются адские трудности.

geek ★★★
(28.11.06 21:08:02 MSK)

Ответ на: комментарий от geek 28.11.06 21:08:02 MSK

>Вот тут и начинаются адские трудности.

Какие?

anonymous
(28.11.06 22:53:27 MSK)

Ответ на: комментарий от anonymous 28.11.06 22:53:27 MSK

trudnosti vsegda est`, nu tut oni preuvelicheni.

divenvrsk ★
(28.11.06 23:02:48 MSK) автор топика

Ответ на: комментарий от divenvrsk 28.11.06 23:02:48 MSK

А без трудностей не интересно :)

anonymous
(28.11.06 23:16:34 MSK)

Ссылка

Ответ на: комментарий от anonymous 28.11.06 22:53:27 MSK

>Какие?

просто в один прекрасный момент оказывается, что нельзя отделять выделение глифов от собственно распознавания. Потому что получаецо хня =)

geek ★★★
(29.11.06 07:26:16 MSK)

Ответ на: комментарий от geek 29.11.06 07:26:16 MSK

Могу только догадываться. Трудности с сегментацией или что-то другое?

anonymous
(29.11.06 13:26:30 MSK)

Ссылка

Похожие темы