Cuneiform Linux 0.3

cuneinform, ocr

0

0

Продолжается работа по адаптации OCR-движка Cuneinform к POSIX-совместимым системам. В новой версии Юсси Пакканен добавил поддержку 64-битных систем, а также возможность экспортировать в HTML результаты распознавания текста, включая жирные и курсивные выделения.

Исходные коды доступны по адресу: https://launchpad.net/cuneiform-linux...

>>> Подробности

Ссылка

←	Авиаколледж выбирает GNU/Linux

ISO отклонило аппеляции против принятия OOXML как стандарта

→

Пилите ещё, пилите...

JackYF ★★★★
(17.08.08 20:49:46 MSD)

Ссылка

ЗАЧЕМ ? сносно работающая под Linux, ВЕЩЬ - есть. и под канонической GPLv3

BasileyOne
(17.08.08 20:51:58 MSD)

Ответ на: комментарий от BasileyOne 17.08.08 20:51:58 MSD

Это вы о чём? О gocr, который не понимает русский и с многоколоночными текстами работает так, что лучше бы и не работал?

router ★★★★★
(17.08.08 21:07:38 MSD)

Ответ на: комментарий от router 17.08.08 21:07:38 MSD

отнюдь GPL Ocr проектов - СИЛЬНО больше одного.

BasileyOne
(17.08.08 21:11:39 MSD)

Ответ на: комментарий от BasileyOne 17.08.08 21:11:39 MSD

А написать примеры свободных ocr понимающих русский?

Killer-mazila
(17.08.08 21:15:59 MSD)

Собрал под арчем, а оно сегфолтится перманентно, разбираться влом, но надеюсь допилят.

anonymous
(17.08.08 21:16:57 MSD)

Ссылка

Гуя так и нет?

anonymous
(17.08.08 21:26:04 MSD)

Ссылка

> включая жирные и курсивные выделения.

Ох уж эти выделения. Лечат, лечат, а выделения все жирнее и курсивее.

andreyu ★★★★★
(17.08.08 21:51:52 MSD)

Ссылка

Ответ на: комментарий от BasileyOne 17.08.08 21:11:39 MSD

Ну так пример в студию. В предыдущем сообщении вы говорили о каком-то уже работающем проекте.

router ★★★★★
(17.08.08 22:06:28 MSD)

Ссылка

О! Скорость развития внушает оптимизм! Надо скачать и попробовать.

fractaler ★★★★★
(17.08.08 22:10:37 MSD)

Ссылка

Ответ на: комментарий от Killer-mazila 17.08.08 21:15:59 MSD

Ты писать программы собираешься или список? ;)

Напиши, пожалуйста, и то и другое! Для начала список...

zhjake
(17.08.08 22:16:48 MSD)

молодцы!

~~mint~~ ★
(17.08.08 22:20:55 MSD)

Ссылка

Ответ на: комментарий от zhjake 17.08.08 22:16:48 MSD

Там была просьба от меня к BasileyOne.

Killer-mazila
(17.08.08 22:56:53 MSD)

Ссылка

АВТОРЫ НОВОСТИ! пРЕЖДЕ ЧЕМ СООБЩАТЬ, ПРОВЕРЯЙТЕ НА РАБОТОСПОСОБНОСТЬ! пОКА НЕ БЫЛО СООБЩЕНИЙ ОБ УСПЕШНОЙ РАБОТЕ, ТОЛЬКО СЕГФОЛТЫ.

yaleks
(17.08.08 23:00:56 MSD)

Ответ на: комментарий от BasileyOne 17.08.08 21:11:39 MSD

> отнюдь GPL Ocr проектов - СИЛЬНО больше одного.

Дайте список. Платные тоже включите, если они в пределах $250.

skwish ★★
(17.08.08 23:05:52 MSD)

Ссылка

Теперь о каждом коммите в дерево сорсов писать будете? Может дотянете проект до хоть чуть-чуть работоспособного состояния, а потом писать уже новости?

Metallic ★
(17.08.08 23:24:19 MSD)

Ответ на: комментарий от Metallic 17.08.08 23:24:19 MSD

> Теперь о каждом коммите в дерево сорсов писать будете? Может дотянете проект до хоть чуть-чуть работоспособного состояния, а потом писать уже новости?

Поддерживаю. Хотел написать о выходе 0.3 ещё за день до того, как эта новость на опеннете появилась, но скомпилив и попробовав хоть что-то распознать, получил сегфолт. Решил что лучше не надо :)

XEN
(17.08.08 23:59:42 MSD)

Ссылка

Ответ на: комментарий от yaleks 17.08.08 23:00:56 MSD

>АВТОРЫ НОВОСТИ! пРЕЖДЕ ЧЕМ СООБЩАТЬ...

"У вас ус^W капс отклеился" =)

~~FiXer~~ ★★☆☆☆
(18.08.08 00:16:19 MSD)

Ссылка

Ответ на: комментарий от Killer-mazila 17.08.08 21:15:59 MSD

>А написать примеры свободных ocr понимающих русский?

одни заняты флеймом на лоре, другие развитием имиджа. некому писать. сам пиши.

anonymous
(18.08.08 00:59:24 MSD)

Оно хоть у одного человека заработало без сегфолтов?

lystor ★★
(18.08.08 01:24:55 MSD)

Ссылка

Ответ на: комментарий от anonymous 18.08.08 00:59:24 MSD

> одни заняты флеймом на лоре, другие развитием имиджа. некому писать. сам пиши.

Погуглил.

OCRE ( http://lem.eui.upm.es/ocre.html ) на сайте сказано, что оно умеет русский.

Ещё была рабочая, судя по отзывам разработка, даже на ЛОРе писали про неё http://www.linux.org.ru/view-message.jsp?msgid=1592861 но живых линков я не нашёл.

Далее Clara OCR ( http://www.geocities.com/claraocr/ ) - в пакет включены наработки по распознаванию кириллического текста.

Кроме этого есть группа http://groups.google.com/group/tesseract-ocr-russian/ которые занимались обучением русскому tesseract'а и фраза на http://sites.google.com/site/ocropus/languages о том что "OCRopus supports all the languages and scripts that Tesseract supports through the Tesseract plugin, and it supports Latin script and English for its native recognizers"

Ну вроде всё.

Killer-mazila
(18.08.08 02:53:44 MSD)

Ответ на: комментарий от Killer-mazila 18.08.08 02:53:44 MSD

Еще есть дорогой проприетарный Kadmos OCR/ICR ( http://www.rerecognition.com/ ) в котором также заявлена кириллица.

Killer-mazila
(18.08.08 03:08:09 MSD)

Ссылка

ждем 1.0

sid350 ★★★★★
(18.08.08 03:15:22 MSD)

Ссылка

сегфолт, сегфолт, сегфолт говорит оно мне третий день на amd64...

ergil ★★★
(18.08.08 07:36:41 MSD)

Ссылка

> В новой версии Юсси Пакканен добавил поддержку 64-битных систем

/me внимательно следит за успехами, готов помочь материально

anonymous
(18.08.08 08:51:41 MSD)

Ссылка

Ответ на: комментарий от Killer-mazila 18.08.08 02:53:44 MSD

>> одни заняты флеймом на лоре, другие развитием имиджа. некому писать. сам пиши.

>Погуглил.

гуглить могут все.

anonymous
(18.08.08 09:10:01 MSD)

Ответ на: комментарий от Killer-mazila 18.08.08 02:53:44 MSD

> Погуглил.
> OCRE ( http://lem.eui.upm.es/ocre.html ) на сайте сказано,

На заборе тоже сказано.
Свои впечатления от _использования_, плиз.

TI_Eugene ★★
(18.08.08 10:03:14 MSD)

Ссылка

Ответ на: комментарий от anonymous 18.08.08 09:10:01 MSD

>гуглить могут все.

Ошибаешься. Некоторые знают только mail.ru, torrents.ru, bash.org.ru, ну, и особо продвинутые может быть rbc.ru и какая-нть lenta.ru.

anonymous
(18.08.08 10:16:35 MSD)

Ответ на: комментарий от Killer-mazila 18.08.08 02:53:44 MSD

>Погуглил. > OCRE ( http://lem.eui.upm.es/ocre.html ) на сайте сказано, что оно >умеет русский. Движок Fine Reader 6-7 версии ,правда лицензия для разработчиков ,закрытая (неразглашение исходников ) и сильно денежная от 15000 зеленых .Вроде только только один из банков и купил .....

maximnik0 ★★
(18.08.08 10:29:49 MSD)

Ответ на: комментарий от yaleks 17.08.08 23:00:56 MSD

>АВТОРЫ НОВОСТИ! пРЕЖДЕ ЧЕМ СООБЩАТЬ, ПРОВЕРЯЙТЕ НА РАБОТОСПОСОБНОСТЬ! пОКА НЕ БЫЛО СООБЩЕНИЙ ОБ УСПЕШНОЙ РАБОТЕ, ТОЛЬКО СЕГФОЛТЫ.

а патч накатать и авторам отослать? чай не вантузятники

black7 ★
(18.08.08 10:34:56 MSD)

Ответ на: комментарий от anonymous 18.08.08 10:16:35 MSD

>Ошибаешься. Некоторые знают только mail.ru, torrents.ru, bash.org.ru,

а вот список из gmail, TPB и 2ch выдает типичное чмо

DNA_Seq ★★☆☆☆
(18.08.08 11:12:39 MSD)

Ссылка

Ответ на: комментарий от black7 18.08.08 10:34:56 MSD

> а патч накатать и авторам отослать? чай не вантузятники

Кой чего рабочее на основе предыдущей версии накатал. В версии 0.3 всё поломалось из-за "поддержки 64-битных систем", если этот патч откатить, то работает.

yaleks
(18.08.08 11:55:08 MSD)

Ссылка

Cuneiform - та еще какашка. Да и загнулась она потому что распознавала на порядок хуже FineReadera. А внутрях термоядерная смесь С и С++, последний раз собиравшееся под VisualStudio 6 с сервиспаками. Документации к этим кодным выделениям никакой. Завязка на Windows.

Теперь еще этот проект. Нет чтобы кроссплатформенным стать, так опять вяжут к платформе. Через полтора года запустят более-менее стабильный порт(это если разработчик интерес не потеряет). Еще год и появится гуй и будет у free software под лицензией BSD горе распознавалка 95-98 года.

Может лучше создать с нуля, чем реанимировать труп?

~~Sancho_s_rancho~~ ★
(18.08.08 12:41:37 MSD)

Ответ на: комментарий от BasileyOne 17.08.08 20:51:58 MSD

> канонической GPL

Нифига я не ошибался, бы все сектанты :(

GFORGX ★★★
(18.08.08 12:53:28 MSD)

Ответ на: комментарий от Sancho_s_rancho 18.08.08 12:41:37 MSD

> Еще год и появится гуй и будет у free software под лицензией BSD горе распознавалка 95-98 года.

Нынче только распознавалки 80-х, что неплохо :)

yaleks
(18.08.08 13:25:21 MSD)

Ссылка

Английский распознает неплохо. Русский - сегфолтится

dmitryilyin
(18.08.08 13:27:22 MSD)

Ссылка

Ответ на: комментарий от maximnik0 18.08.08 10:29:49 MSD

maximnik0> OCRE

РЕШЕТО!!!!

~~Quasar~~ ★★★★★
(18.08.08 13:54:22 MSD)

Ссылка

Ответ на: комментарий от GFORGX 18.08.08 12:53:28 MSD

GFORGX> Нифига я не ошибался, бы все сектанты :(

Преклонись на колено Святому Патрику за сие оскорбление, установи на свой комп первослаку и воспей Патрика трижды!

~~Quasar~~ ★★★★★
(18.08.08 13:56:20 MSD)

Ссылка

Ответ на: комментарий от BasileyOne 17.08.08 20:51:58 MSD

> ЗАЧЕМ ? сносно работающая под Linux, ВЕЩЬ - есть. и под канонической GPLv3

Вы всё ещё не закопали себя?

AP ★★★★★
(18.08.08 14:38:01 MSD)

Ссылка

Ответ на: комментарий от Sancho_s_rancho 18.08.08 12:41:37 MSD

> Может лучше создать с нуля, чем реанимировать труп?

На моей памяти не менее шести таких попыток. Догадываетесь, чем всё кончилось? Создание OCR - ресурсоемкая задача. Много ума, чтобы написать наколенную поделку, не надо. Такие штуки пошутся тоннами в качестве дипломов и курсовых.

Сделать реально работающий проект - вот задача. Которую сообщество пока не осилило.

AP ★★★★★
(18.08.08 14:43:11 MSD)

Ответ на: комментарий от AP 18.08.08 14:43:11 MSD

Да, попыток было много. Результата - 0.

Первое, что раздражает в текущих свободных программах по распознаванию текста - поддержка граф. форматов. Православный pbm - это конечно круто, но пользователю конвертировать картинки с использованием еще одной софтины зачастую моветон. Самый простой выход из этой ситуации - это взять тулкит с поддержкой наиболее распространенных графических форматов. Например Qt поддерживает jpeg, png, tiff, bmp и другие. Минусы - tiff многостраничный не поддерживается(на сколько я помню). Нет, конечно можно прикручивать поддержку гр. форматов самостоятельно, но при ограниченных человеческих ресурсах это не самая лучшая задумка. Впоследствии накрутить можно что угодно.

Второе. Работа со сканером. Если программу изначально разрабатывать как многоплатформенную, то как прикручивать работу со сканером? См. пункт первый, раздел моветон. В данном случае ,конечно, пользователем можно "пожертвовать" т.е. сканеры идут обычно с софтиной для сканирования. Пусть пользуют и не морщатся.

Третье. Софтина ,кровь из носа, должна быть с граф. мордой и поддерживать добавление нескольких файлов и каталогов. Если текст идет в несколько колонок, имеет графику, таблицы, то софтине (даже такой неплохой, как FR) зачастую не удается правильно разложить страницу "по косточкам". Пользователь должен иметь возможность удобно и быстро сделать разбивку вручную. Это занимает минимум времени, но значительно улучшает качество.

Четвертое. Распознавание. Повернуть страницу на нужный угол достаточно просто. Разбить на символы проблематичнее. Если разбивка на символы выполнена, то распознавание - достаточно простая задача в первом приближении. Использовать или нет нейронные сети - еще вопрос. На мой взгляд, нейронные сети - это модно, но далеко не всегда эффективно. Сложнее всего с таблицами. Тут надо долго и упорно шевелить извилинами.

Пятое. Экспорт во всякие ворды и прочие офисы с сохранением форматирования не есть самое главное желание пользователя. Те пользователи коммерческих систем распознавания текста, которых я знал, после экспорта в ворд очищали форматирование. Для начала надо чтобы пользователь получал блоки, помеченные как картинки и текст.

Этот минимум может быть реализован сообществом опенсорц. Другое дело, что может это никому не надо?

~~Sancho_s_rancho~~ ★
(18.08.08 15:49:26 MSD)

Ответ на: комментарий от Sancho_s_rancho 18.08.08 15:49:26 MSD

> Первое, что раздражает в текущих свободных программах по распознаванию текста - поддержка граф. форматов.

Юсси Пакканен изящно решил эту проблему - нативно cuneiform понимает только BMP, но используя ImageMagick осуществлена поддержка гораздо большего числа форматов.

yaleks
(18.08.08 15:56:03 MSD)

Ответ на: комментарий от yaleks 18.08.08 15:56:03 MSD

Да, я смотрел исходники.

А почему он изящно привязал Cuneiform к линукс?

~~Sancho_s_rancho~~ ★
(18.08.08 15:59:11 MSD)

Ответ на: комментарий от Sancho_s_rancho 18.08.08 15:59:11 MSD

> А почему он изящно привязал Cuneiform к линукс?

В каком месте он его привязал к linux? Заявлена работа на MacOS X, других систем у него похоже нет, да на них и OCR не сильно нужно.

Он грязно оторвал CF от винды :)

yaleks
(18.08.08 16:51:54 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Авиаколледж выбирает GNU/Linux

Open Source

ISO отклонило аппеляции против принятия OOXML как стандарта

→

Похожие темы