libocr

0

0

День добрый!

Представляю на суд широкой общественности простенький движок для распознавания отсканированных изображений текстовых документов. Предупреждаю сразу - пока что все весьма и весьма сыро, но первые результаты есть.

Достоинства:
1. Движок оформлен в виде библиотеки, написанной на языке C. Честно говоря, сейчас бы я предпочел плюсы... С другой стороны, такую библиотеку можно использовать и из других языков программирования.
2. Для распознавания символов используется нейросеть, поэтому достаточно легко можно обучить движок новому языку распознавания.

Что можно увидеть сейчас:
1. В архиве лежит библиотека каталог libocr), простенькая консольная программа для распознавания (tools/ocr), программа-тренер для обучения нейросети (tools/trainer) и несколько тестовых страничек (pages).
2. Движок обучен на распознавание прописных букв киррилического алфавита: заглавные буквы, цифры, знаки препинания - не распознаются!

Что нужно для успешной компиляции:
GLib версии 2.10.x (с более старой скорее всего не собирется)
libtiff

http://www.radico.ru/syomin/ocr-r55.tar.bz2

Желаю успеха!

Ссылка

←	Долго не писал на сях. Как сделать вызов функции из форкнутого имиджа?

Django vs Turbogears vs Pylons

→

а можно это выложить отдельно исходниками без картинок и прочего?

bik ★★
(29.09.06 23:49:07 MSD)

Что такое нейросеть? Для меня это такое же расплывчатое понятие как и AI.

Комментарии на русском языке - класс.

Ответ на: комментарий от logIN 30.09.06 01:29:08 MSD

если не умеете пользоваться гуглом, зайдите хотя бы на http://ru.wikipedia.org/wiki/Нейросеть.

bik ★★
(30.09.06 10:27:18 MSD)

Ссылка

Ответ на: комментарий от bik 29.09.06 23:49:07 MSD

Специально по просьбам трудящихся архив только с исходным кодом:
http://www.radico.ru/syomin/ocr-r55-minimal.tar.bz2

syomin ★
(30.09.06 12:12:09 MSD) автор топика

Ответ на: комментарий от syomin 30.09.06 12:12:09 MSD

Не работает ссылочка

AP ★★★★★
(23.10.06 21:11:37 MSD)

Ответ на: комментарий от AP 23.10.06 21:11:37 MSD

Новая версия.
http://www.radico.ru/syomin/ocr-r59.tar.bz2

syomin ★
(02.11.06 12:12:57 MSK) автор топика

Ответ на: комментарий от syomin 02.11.06 12:12:57 MSK

$ make
make: *** Нет правила для сборки цели `.depend', требуемой для `libocr.so'. Останов.

unDEFER ★★★★★
(03.11.06 00:46:20 MSK)

Ответ на: комментарий от unDEFER 03.11.06 00:46:20 MSK

$ make depend
$ make 
cc -Wall -pedantic -O2 -fPIC -I.. `pkg-config --cflags glib-2.0`   -c -o bitmap.o bitmap.c
In file included from bitmap.c:23:
bitset.h:40: error: syntax error before "G_GNUC_WARN_UNUSED_RESULT"
bitset.h:51: error: syntax error before "G_GNUC_WARN_UNUSED_RESULT"
bitset.h:61: error: syntax error before "G_GNUC_WARN_UNUSED_RESULT"
bitmap.c: In function `ocr_bitmap_new':
bitmap.c:38: warning: implicit declaration of function `g_slice_new'
bitmap.c:38: error: syntax error before "OcrBitmap"
bitmap.c: In function `ocr_bitmap_new0':
bitmap.c:54: error: syntax error before "OcrBitmap"
bitmap.c: In function `ocr_bitmap_copy':
bitmap.c:92: error: syntax error before "OcrBitmap"
bitmap.c: In function `ocr_bitmap_free':
bitmap.c:146: warning: implicit declaration of function `g_slice_free'
bitmap.c:146: error: syntax error before "OcrBitmap"
make: *** [bitmap.o] Ошибка 1


Так как она собирается?

unDEFER ★★★★★
(03.11.06 00:49:59 MSK)

Ответ на: комментарий от unDEFER 03.11.06 00:49:59 MSK

Собирается так:
make depend
make

Перед сборкой убедитесь, что у вас установлен pkg-config, а также заголовочные файлы для glib2 и libtiff.

syomin ★
(07.11.06 16:25:26 MSK) автор топика

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Долго не писал на сях. Как сделать вызов функции из форкнутого имиджа?

Development

Django vs Turbogears vs Pylons

→