LINUX.ORG.RU

Cuneiform-Qt — графический интерфейс к Cuneiform

 ,


0

0

Вышла версия 0.1.1 программы Cuneiform-Qt — графического интерфейса к программе распознавания текстов Cuneiform — лучшей на сегодня из свободных программ OCR под Линукс.

Интерфейс использует библиотеку Qt4. Пока программа работает только с файлами изображений и не умеет взаимодействовать с SANE.

Автор — Андрей Черепанов, участник команды Alt Linux.

Сообщение в блоге автора

Исходный текст

>>> Страница программы

★★★★★

Проверено: Dimez ()
Ответ на: комментарий от Devix

> Ну что нам стоит ждать Unix Way в твоем исполнении?

Он уже есть, так как используется вызов консольного бэкенда. Нужно будет прикрутить распознавание PDF — сделаю вызов gs с параметрами. Хотите правоверного Unix Way — используйте gs/tiffsplit/cuneiform/latex. Оно уже есть и работает. Но у этой связки недостаёт удобства для обычного пользователя.

Skull ★★★★★
()

Тем, кто здесь высказывался, что "это не нужно" и "Файнридер - наше все!" должен сказать, что файнридер при всех его неоспоримых достоинствах как распознавалки крайне НЕУДОБЕН в Linux. Он никак не вписывается в традиционную конвейерную обработку: например, скрипт, который при нажатии кнопки на сканере сканирует страницу, распознает (как может) и вставляет в конец документа. С ocrad такое возможно, а с finereader - увы!

Что касаемо морды, то наверное она кому-нибудь пригодится именно как прямая замена файнридеру, а может она подогреет интерес к cuneinform-linux и даст точок к его совершенствованию.

KS ★★
()
Ответ на: комментарий от Gorrion

> Ща все лучшие программы на qt пишут)

Ололо, qt бодрым шагом бежит в сторону GNOME. Чувствую, придётся KDE'шникам переползать на fltk....

atrus ★★★★★
()
Ответ на: комментарий от question4

вы думаете, что все тексты сканируются идеально и программы идеально все распознают?

вы глубоко ошибаетесь.

по статистике 90% всего времени занимает проверка (в сравнении с оригинальным изображением) и редактирование текста.

распознавание текста - это кропотливая офисная работа.

здесь нет места unix-way

GotDotNetMono
()
Ответ на: комментарий от KS

OpenOffice - тоже неудобен под Линукс, потому что "никак не вписывается в традиционную конвейерную обработку"?

А Latex - вписывается.

Но Latex - не офисный процессор.

Так и с ocrad

GotDotNetMono
()
Ответ на: комментарий от Deleted

Он тоже?

>shahid *** (*) (08.04.2009 19:53:15)

>Долбоящер? Сам хоть что-нибудь полезное сделал в жизни?

GotDotNetMono
()
Ответ на: комментарий от GotDotNetMono

> по статистике 90% всего времени занимает проверка (в сравнении с оригинальным изображением) и редактирование текста.

Ссылку на эту статистику можно привести?

Из своего недолгого опыта знаю, что это не так. Документ должен вычитываться — только так можно добиться хорошего результата. Даже очень развитые средства подсветки и прочие примочки не дают высокого качества результата.

Skull ★★★★★
()
Ответ на: комментарий от GotDotNetMono

> по статистике 90% всего времени занимает проверка (в сравнении с оригинальным изображением) и редактирование текста.

Ссылку на эту статистику можно привести?

Из своего недолгого опыта знаю, что это не так. Документ должен вычитываться — только так можно добиться хорошего результата. Даже очень развитые средства подсветки и прочие примочки не дают высокого качества результата.

Skull ★★★★★
()
Ответ на: комментарий от Skull

>> Т.е. GTK+ не напрягает, а WINE - напрягает? Несколько странно.

>Сколько ресурсов использует один и другой тулкит сами догадаетесь?

Если комп тянет - мне какая разница? У меня тянет оба тулкита, хотя ГТК конечно тормоз, но я согласен с этим мириться.

EmStudio
()
Ответ на: комментарий от Skull

> Завидно, что Вам лично нечего показать?

Конечно нечего. Я хотел написать, так у меня от этого куниформа волосы дыбом вставали (когда читал ихний форум разрабочиков). А вот делать бесполезные формочки для ниасиляторов - это не мой удел, извините.

EmStudio
()
Ответ на: комментарий от question4

> Отсканировал книгу, нарезал страницы в ImageMagic, пропустил через распознаватель. Если сканер нормальный, книгу клал ровно, достаточное разрешение, количество колонок на всех страницах одинаково, и нет ни таблиц, ни картинок, то вычитка почти не требуется.

А вы сами сканировали? "Нормальные" сканеры - это что-то из области фантастики, у каждого есть свои недостатки, "класть ровно" можно далеко не всегда (порой надо разбирать на листочки), про колонки уже смешно. Условия для коня в сферическом вакууме. Я в своей юности сканировал, причем много, я знаю о чем говорю.

> Открываем 2 окна на пол-экрана каждое: в одном картинка, в другом — редактор с текстом. И обошлись без гуя :)

И постоянно пытаемся между этими окнами синхронизироваться, на что тратим 80% времени.

> собенно если нет хорошего сканера и было лень ровно положить книгу

Да чего уж мелочиться. Если небыло электронной версии сразу.

А возможность поворота изображений и убирания теней - первостепенна для таких программ.

EmStudio
()
Ответ на: комментарий от Skull

личный опыт тысяч пользователей на 50 страницах и выше.
и >100-200 документов.

На таких обьемах оптимальный интерфейс на первом месте.

В Finereader есть понятие "неуверенно распознанного символа".
А в Cuneifrom?

а если резкость потеряна, неверно распознанный блок, ... - тогда только заново набирать, редактировать и привязка "текст-изображение" обязательна.

GotDotNetMono
()
Ответ на: комментарий от GotDotNetMono

Дык файнридер - тоже далеко не идеал, просто лучшее из написанного для наших условий.

EmStudio
()
Ответ на: комментарий от GotDotNetMono

> вы думаете, что все тексты сканируются идеально и программы идеально все распознают?

Конечно нет. Я смеялся :)

> здесь нет места unix-way

Рекомендую поискать в гугле отзывы о FineReader-е. Его сравнение с ReadIris и другими. Общий вывод: распознаёт хорошо, но с автоматизацией могло бы быть и получше. А для автоматического распознавания "как на конвейере" GUI не нужен. Только для тяжёлых случаев.

Если же у вас все случаи "тяжёлые", требующие кропотливой работы, значит что-то у вас не так организовано.

question4 ★★★★★
() автор топика
Ответ на: комментарий от EmStudio

> А вы сами сканировали?

Неоднократно.

> "Нормальные" сканеры - это что-то из области фантастики, у каждого есть свои недостатки,

Особенно после 6 лет работы в комнате-проходном дворе :)

> "класть ровно" можно далеко не всегда

Непрочные книги в мягком переплёте, кривопереплетённые подшивки, что ещё? С ксерокопиями возиться сравнительно долго.

> (порой надо разбирать на листочки),

Ну да. А как ещё отсканировать текст, попавший под скрепку? Сквозь бумагу?

> про колонки уже смешно.

Специально для этого их и вспомнил :)

> И постоянно пытаемся между этими окнами синхронизироваться, на что тратим 80% времени.

Alt-Tab, PgDn, Alt-Tab, PgDn, Alt-Tab, PgDn, Alt-Tab, PgDn...

Я не говорю, что это лучше интегрированной системы :)

> А возможность поворота изображений и убирания теней - первостепенна для таких программ.

Imagemagic :)

question4 ★★★★★
() автор топика
Ответ на: комментарий от question4

>А для автоматического распознавания "как на конвейере" GUI не нужен

а чо это такое?

вот Formreader и Testreader - автоматизация на конвеере.

И там GUI и еще какой.

плюс встроенные скрипты проверки.

тоже продукция Abbyy.

а у Cuneiform?

PS. Вы что, считаете, что машина умеет читать лучше человека?

глубко ошибаетесь.

GotDotNetMono
()

Автору Спасибо! (хотя мне OCR особо и не нужен, и прогу не ставил)
EmStudio, ну вы клоун ей богу ))
Видимо в каждом новостном треде на ЛОРе, как в цирке, должен быть свой, персональный клоун...

> Вот что за люди? Сами палец о палец не ударили, а пришли в треде

> посрать и в автора поплеваться. Совесть поимейте.

> Автор делает не ради бабок, а просто так. За что ему уже большое спасибо.

> Mikael (*) (08.04.2009 17:51:41)

+1

Tayler ★★
()
Ответ на: комментарий от question4

по поводу автоматизации

FR имеет
1) Batch mode и скрипты записываТь
2) Finereader Developer - создавать приложения на движке Finereader

автоматизируй сколько нужно!

они FR не очень хорошо смотрели.

GotDotNetMono
()
Ответ на: комментарий от question4

> Imagemagic :)

Скорее гимп + скрипт для "приведения в порядок", запускающий выравнивание, осчистку и процее, допускающие доведение руками. Ибо что-то я не помню в Imagemagick опций "найти край текста и выровнять страницу".

EmStudio
()
Ответ на: комментарий от SplindeR

> Ну, я вот, к примеру принципиально не пользуюсь консольными приложениями. Потому что набирать вручную какие-то команды почитаю за фгм.

С этим поспорю, во многих случаях набрать команду (особенно если это вызов скрипта) быстрее, чем лазить мышой по меню.

> А вот за написанную форму с 2 окошками - автору большое спасибо, теперь можно будет пользоваться. Так что очень даже не лишняя штука.

С этим согласен, автор молодец, что начал. Главное, чтоб не бросил.

hobbit ★★★★★
()
Ответ на: комментарий от Skull

Одно только смутило...

> Подавляющему большинству нужно отсканировать на нормальном сканере и распознать.

А какие сканеры Вы относите к нормальным?

(Задумчиво смотрит на своё бюджетное МФУ от HP)

hobbit ★★★★★
()
Ответ на: комментарий от GotDotNetMono

>.NET и Mono РАБОТАЮТ! На примере Dyson уже посмотрели, как mono работает. На x86_64 вообще не запускается, на x86 у половины сегфолтится.

Laz ★★★★★
()

Черепанов в своей манере - даже URL git - c "исподвыподвертом":
git clone "http://git.altlinux.org/people/cas/packages/?p=cuneiform-qt.git;a=summary "
Initialized empty Git repository in /mnt/shares/data/Version/GIT/?p=cuneiform-qt.git;a=summary/.git/
fatal: http://git.altlinux.org/people/cas/packages/?p=cuneiform-qt.git;a=summary/inf... download error - The requested URL returned error: 400

TI_Eugene ★★
()

продолжаем конструктивную критику сего продукта:

1) frontend использует MFC - не поддерживается юникод
2) англоязычная версия сделана через пень колоду (выход на западные рынки перекрыт)
3) обязательно наличие MS Office - платного проприетарного продукта!
В freeware версии от декабря 2007 этого не было!
4) распознанный документ сохраняется только в проприетарном DOC (Finereader - PDF, ODT, ODS,прошу заметить открытые стандарты)

куда идете товарищи?

GotDotNetMono
()
Ответ на: комментарий от Skull

>Смотрите в TODO в коде и на русском http://www.altlinux.org/Cuneiform-Qt#TODO

Спасибо. Планы - это хорошо. Хотелось бы помимо цветокоррекции еще и некоторые фильтры видеть (дилатация, эррозия, резкость, размытие и т.п.), если я в wiki отмечусь, это в todo внесете?

>А чем она не полезная?

Она никакого функционала не привносит, который был бы недоступен или доступен с меньшими затратами времени из консоли. Я об этом. По сравнению с консолью ее полезность это как полезность juk, dragon player в сравение с mplayer.

malices_gossips ★★★
()
Ответ на: комментарий от MageasteR

неплохая идея.

сделать нормальный кроссплатформенный GUI frontend на .NET/Mono

GotDotNetMono
()

да и еще скажите мне:

как добавить табличный блок?

В Finereader не было с этим никаких проблем.

П.С. А форум закрыли из-за потока спама?

GotDotNetMono
()
Ответ на: комментарий от GotDotNetMono

почему работает select text, select picture но не работает select table?

кто ответит мне на этот вопрос при неработающей поддержке?

GotDotNetMono
()
Ответ на: комментарий от GotDotNetMono

> распознанный документ сохраняется только в проприетарном DOC

Который внутри — хорошо документированный RTF :)

> продолжаем конструктивную критику сего продукта:

Сколько раз необходимо повторить чтобы стало понятно?

Данная новость относится к консольной программе под линукс (но работоспособной и в других ОС), домашняя страница которой https://launchpad.net/cuneiform-linux, а исходники находятся по адресу http://launchpad.net/cuneiform-linux/0.6/0.6/+download/cuneiform-0.6.tar.bz2

Критика относится к программе с домашней страницей на http://openocr.org/ и исходниками по адресу http://www.cuneiform.ru/downloads/cuneiform_src.zip

Обе эти программы используют код CuneiForm, созданной Cognitive Technologies, но уже много месяцев развиваются независимо.

Возмущение не по адресу.

question4 ★★★★★
() автор топика
Ответ на: комментарий от GotDotNetMono

> к журналам диски смотри

Каким журналам? Каких лет? Если FR 6 несколько раз продавали в комплекте с журналом, это не делает его бесплатным. Где его можно бесплатно получить сейчас?

question4 ★★★★★
() автор топика
Ответ на: комментарий от GotDotNetMono

> я его получил бесплатно (журнал - 150 рублей) месяц назад. официально. с поддержкой по e-mail.

Значит в эти 150 р. вошли и стоимость журнала, и стоимость диска, и стоимость поддержки :)

Какой журнал?

question4 ★★★★★
() автор топика
Ответ на: комментарий от GotDotNetMono

Я вообще на флеше хотел делать, там с графикой вообще просто работать, да и гуи лепятся практически мгновенно.

EmStudio
()
Ответ на: комментарий от GotDotNetMono

> Помоему тут .NET/Mono это самое адекватное решение.

Пиши, кто мешает...

question4 ★★★★★
() автор топика

Oleaster, xintrea — где же вы? EmStudio с готдотнетом не справляются. Выдохлись, бедолаги.

AP ★★★★★
()
Ответ на: комментарий от question4

ну не сайте, а на диске к журналу и акция уже закончилась.

получить серийный ключ можно было получить на сайте ABBYY.

GotDotNetMono
()

в общем, я жду от господ GotDotNetMono и EmStudio работающий бесплатный и свободный (хотя можно просто бесплатный) мультиплатформенный OCR, распознающий таблицы и плохочитающийся текст. Иначе сами понимаете, забаню. Когда ждать первого этапа?

Deleted
()
Ответ на: комментарий от EmStudio

Не сочтите за оскорбление. Вы идиот. Повторяю, это не оскорбление, это факт. После всех объяснений говорить, что эта новость - пеар.. Либо идиотизм, либо личная неприязнь, что тоже в конечном итоге сводится к идиотизму.

GreyDoom ★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.