LINUX.ORG.RU

ScanTailor 0.9.3

 , ,


1

0

Относительно недавно вышла очередная версия свободной кросс-платформенной программы для обработки отсканированных книг ScanTailor 0.93.

Всякий, сканировавший когда-либо книгу для перевода в djvu, знает, что чтобы получить хорошее качество, после сканирования книгу нужно специальным образом обработать. То есть, разрезать разворот на две страницы, удалить чёрные полосы по краям, выровнять строчки по горизонтали, удалить шум и перевести в ч/б. После такой обработки и читать приятно, и размер файлов значительно меньше.

ScanTailor — первая и пока единственная кросс-платформенная программа, обрабатывающая сканы для djvu в пакетном режиме, с графической оболочкой, выпущенная под свободной лицензией. Пока пакет scantailor есть только в ALT Sisyphus.

>>> Подробности

Ответ на: комментарий от tomodachi_ni_narimashou

> Кто покупает книги без исходников, тот лох!

Специально по вашему заказу можно сделать исходники книги года так 20-го

каждая страница по пол кило минимум. готовтесь принять пол тоны

namezys ★★★★
()
Ответ на: комментарий от Frolic

Вот нефиг на дистрибутив\авторов пенять, коли руки кривы. Под убунтой оно собирается с пол пинка. libjpeg-dev, libtif-dev, libpng-dev стоят?

petrosyan ★★★★★
()
Ответ на: комментарий от tomodachi_ni_narimashou

Не подсткажите, гиде можно прибрести книжки под GPL с исходниками и заодно мини-типографию для "сборки"?

petrosyan ★★★★★
()
Ответ на: комментарий от Obey-Kun

>Как много хороших программ на Qt4 появляться стало...

У меня даже дежавю на тему "барланд выпустил делфи".

r ★★★★★
()
Ответ на: комментарий от Frolic

Незнаю у кого там какие проблемы в слаке, но у меня в генте собралось без нареканий

Gorthauer ★★★★★
()
Ответ на: комментарий от petrosyan

>Вот нефиг на дистрибутив\авторов пенять, коли руки кривы. Под убунтой оно собирается с пол пинка. libjpeg-dev, libtif-dev, libpng-dev стоят?

уже стоят, осталось
CMake Error at CMakeLists.txt:178 (QT4_WRAP_UI):
Unknown CMake command "QT4_WRAP_UI".


-- Configuring incomplete, errors occurred!

с этим та как бороться?

Frolic
()

Если Ubuntu 9.04 разочарует, буду смотреть ALTы...

eugrus ★★★★★
()
Ответ на: комментарий от Frolic

Странно. Должно все собраться, если все нужные зависимости для сборки стоят. Правда, у меня 9.04, может конкретно с 8.10 косяк?

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

По моему он бот - ибо только одну фразу от него и слышно)))

bioreactor ★★★★★
()
Ответ на: комментарий от Frolic

>CMake Error at CMakeLists.txt:178 (QT4_WRAP_UI):
Unknown CMake command "QT4_WRAP_UI".
Ну ваще он черным по белу тебе молвит! Не вижу я модулей qt для cmake'а. Поставь libqt4-dev, automoc,и ещё какую то ересь
а ваще попробуй auto-apt

Gorthauer ★★★★★
()

А почему нет поддержки bmp формата? У меня сканы в bmp по определённой причине (tiff не канает). Поддержка нескольких форматов без потерь важна - т.к. я так понимаю в основном сначала кромсают потом конвертят скажем в jpeg.

Mr_Nobody
()
Ответ на: комментарий от Mr_Nobody

>А почему нет поддержки bmp формата? У меня сканы в bmp по определённой причине (tiff не канает). Поддержка нескольких форматов без потерь важна - т.к. я так понимаю в основном сначала кромсают потом конвертят скажем в jpeg.
А понту сначала кромсать, а потом конвертать.
В школе не учил что от перемены мест слогаемых сумма не меняется, берем баш и все скопом конвертим в jpeg, если с должным стоянием рук сделаеш то и потерь не заметиш.

Frolic
()
Ответ на: комментарий от Frolic

> CMake Error: The following variables are used in this project, but they are set to NOTFOUND
Перевести на русский?

Поставь libjpeg-devel, libpng-devel
и т.д.

TI_Eugene ★★
()
Ответ на: комментарий от Gorthauer

>Ну ваще он черным по белу тебе молвит! Не вижу я модулей qt для cmake'а. Поставь libqt4-dev, automoc,и ещё какую то ересь
а ваще попробуй auto-apt

Поставил libqt4-dev и все собралось и работает, большое спасибо за помощь.

Frolic
()
Ответ на: комментарий от Rexy-Craxy

>На всякий случай-2: доводилось быть мейнтейнером/сборщиком спец. LiveCD-дистров, в т.ч. под зоопарк deb/rpm/tgz. Поэтому если говорю: косяк в скриптах сборки -- значит косяк в скриптах сборки :P

Оно и понятно почему доводилось быть.

Frolic
()
Ответ на: комментарий от MooSE

> > Пока пакет scantailor есть только в ALT Sisyphus.

> Грязный пеар:)

> MooSE *** (*) (10.04.2009 14:43:49)


Абсолютно согласен с аффтаром! :-)

2 moderator: уберите это. Я ж сказал - уже есть под федору и мандриву. Сцылко повторить?

TI_Eugene ★★
()
Ответ на: комментарий от Frolic

Если сконвертить в jpeg будет я так понимаю многократное преобразование в jpeg. Нормальные люди сначала редактируют-крутят вертят по всякому формат без потерь - и ЛИШЬ В КОНЦЕ конвертят в jpeg.

Mr_Nobody
()
Ответ на: комментарий от Mr_Nobody

> Если сконвертить в jpeg будет я так понимаю многократное преобразование в jpeg. Нормальные люди сначала редактируют-крутят вертят по всякому формат без потерь - и ЛИШЬ В КОНЦЕ конвертят в jpeg.

Не это страшно

Страшно что jpeg сделает с буквами. Он совсем для этого не предназанчен

namezys ★★★★
()
Ответ на: комментарий от Mr_Nobody

>Если сконвертить в jpeg будет я так понимаю многократное преобразование в jpeg. Нормальные люди сначала редактируют-крутят вертят по всякому формат без потерь - и ЛИШЬ В КОНЦЕ конвертят в jpeg.

Ты что делаеш фотоальбом для професиональных фотографов?
Начнем с того что скан делался на домашнем сканере, так что все последуещие понты, безпонтовые. во загнул.
Конверти в jpeg и не нуди.

Frolic
()

Там кто-то говорил что передаст автору.
Тогда будьте добы передать что при компенсации наклона хоршо бы сделать накладывающуюся вертикальную сетку с регулируемым шагом, потому что так как есть не всегда удобно, и порой нереально компенсировать наклон.

Frolic
()
Ответ на: комментарий от Frolic

Зачем делать гавно если можно этого избежать? Разница есть (если многократно конвертить в формат с потерями). Смысл в том, чтобы сделать полезную прогу.

Если же следовать вашей логике - то зачем вам сетка - конверти как есть и не нуди - всё равно всё размоет так что неважно что там небольшой наклон.

Mr_Nobody
()

0.9.3 это афтар очень погарчился.
делал резал, выделял область, а на стадии вывода, его сглюкнуло и все, нифига не сохранил, 40 минут работы коту под хвост, ждев версии 2.0, а до этого проект UNSTABLE

И еще сударь, если руки кривые то и BMP не поможет.

Frolic
()

Сначала было подумал: зачем нужна программа, если есть unpaper? Но попробовав понял - нужна! Не говоря об удобстве GUI программа работает лучше чем unpaper. Кстати, программа, пришлась как раз в пору, так как намечает OCR... В общем, спасибо автору!

Кому лень собирать самому могут скачать deb для amd64: http://rapidshare.com/files/219650057/scantailor_0.9.3-1_amd64.deb

P.S.: А заодно (может кому надо) и cuneiform: http://rapidshare.com/files/219651934/cuneiform_20090408-0.6.0_amd64.deb

swmail
()
Ответ на: комментарий от TI_Eugene

>Для сусе пока не будет - надо проставить правильные категории в desktop.

ближе всего

Graphics;Scanning;

HighwayStar ★★★★★
()

на лоре неделя программ для работы с книгами от альтовцев?

ei-grad ★★★★★
()

Потребители...

Авторы молодцы. Все, кто пишет нужные хотя бы себе программы, - молодцы.

Все, кто что-то делает, - молодцы.

И только лохи-потребители, ждущие от других не понятно чего, брызжущие слюной на любое созидание - быдло.

ip1981 ☆☆
()
Ответ на: комментарий от ip1981

> Потребители...

> Авторы молодцы. Все, кто пишет нужные хотя бы себе программы, - молодцы.

> Все, кто что-то делает, - молодцы.

> И только лохи-потребители, ждущие от других не понятно чего, брызжущие слюной на любое созидание - быдло.

Присоединяюсь.

MooSE ★★★★
()
Ответ на: комментарий от AP

И еще xsane туда вшить. Было бы прикольно - сканируешь, обрабатываешь, распознаешь да еще и сохраняешь не в какой-то богомерзкий пдф, а в православный djvu Короче наш ответ FineReader

petrosyan ★★★★★
()
Ответ на: комментарий от Frolic

> фотоальбом для професиональных фотографов?

ЩИТО?

AP ★★★★★
()
Ответ на: комментарий от Frolic

> 0.9.3 это афтар очень погарчился... ждев версии 2.0, а до этого проект UNSTABLE

Не того человека назвали Петросяном.

Как минимум те полтора года, что я слежу за проектом, авторы пишут русским по белому, что программа нестабильна. А ты до этого только сейчас эмпирическим путем допёр :)

AP ★★★★★
()
Ответ на: комментарий от AP

Нет. Это разные программы, которые точно не нужно объединять в комбайн. Вот иметь группу "Сканобработка" в рамках одного дистрибутива - это дело.

constRS
() автор топика
Ответ на: комментарий от ip1981

Все предпочитают. Не у всех получается - сильно от сканера зависит.

constRS
() автор топика
Ответ на: комментарий от petrosyan

Ну, как учит нас семья и школа - чтобы решить задачу, нужно разделить её на подзадачи. Дальше, если подзадачи решены, можно собирать обратно. На мой взгляд, OCR и обработка для DJVU пересекаются слабо: фактически только по выравниванию строк. Т.е. совместный комбайн будет рыхлой, объёмной, неудобной конструкцией.

Я делал в своё время аналог unpaper, только с предпросмотром (маленькие ч/б картинки, где помечено, что отрезано и как). Поэтому могу сказать точно - для обработки сканов в djvu нужна графическая оболочка и не нужен OCR. И хотя в своё время bolega утверждал, что удаление грязи (despeckle) лучше делать с OCR, такого алгоритма нет.

А если OCR не нужен, то и пихать их вместе не следует. Это не Ъ с консолью, а разумное разделение задач.

constRS
() автор топика
Ответ на: комментарий от AP

>Как минимум те полтора года, что я слежу за проектом, авторы пишут русским по белому, что программа нестабильна. А ты до этого только сейчас эмпирическим путем допёр :)

Нолик в начале само собой подразумивает нестабильность.
Но следующая девятка говорит о том что остался один шаг до стабильного релиза, а тут первую книгу вообще не открыло, сигминтэешен фаулт.
Вторую открыло но не сохранило и интерфейс таво, плюс при сохранении проекта не сохранилась проделанна работа.
так что вторая цифра должна быть 1 но максимум 3, но не как не 9.
Но проект конечно хороший, очень удобный интерфейс.
ждемс стабильного релиза с нетерпением.

Frolic
()
Ответ на: комментарий от constRS

Создание электронной книги это единый процесс начиная от сканирования и заканчивая добавлением ocr слоя к djvu файлу. Почему бы не использовать для одного процесса одну многофункциональную программу ака комбаин? Если я наделал сканов, то почему бы их сразу не отходя от кассы насканированое обработать, а обработав тут же не сохранить в нужный формат прямо из редактора? Если комбайн организован по уму, а не превращен в монстра, то не вижу в нем ничего плохого. Впрочем, дело вкуса.

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

Потому, что

1) См. стандартный путь решения естественнонаучных задач - разделение этапов и решение нескольких простых задач. Написать мелкие утилиты легче, чем комбайн.

2) при обработке книг желательно сохранять промежуточные результаты - слишком велика цена ошибки на книжке в 600 dpi. Когда на средней машинке только автоматический этап обработки занимает 2-3 часа, очень не хочется терять результаты каждого этапа. Опять-таки, переделывать уже ПРОВЕРЕННЫЕ ВРУЧНУЮ развороты никто не захочет.

В комбайне же тяжело использовать промежуточные итоги, а в наборе утилит это делается естественно. Комбайн обычно нужен именно для скрытия промежуточных результатов, чтобы не мусорить.

3) Сам ScanKromsator ругают за отсутствие нормальной документации и запруженность опциями - см. дискуссии bolega и monday2000 на forum.ru-board.com Это результато архитектуры "комбайна".

Автор ScanTailor попытался учесть эти претензии, и фактически собрал под одной граф. крышей несколько разных утилит, НЕ СМЕШАВ их. Одна графическая оболочка полезна т.к. эти утилиты требуют, если не одинаковых, то несомненно очень похожих оболочек.

Если вы взгляните на интерфейс ScanTailor и творения глубокоуважаемого Skull, вы легко обнаружите, что интерфейсы, мягко говоря, разные.

Поэтому нет смысла из 2-х удобных утилит делать одно неудобное говно (придётся идти на компромиссы, чтобы сшить интерфейсы).

--------------------

Соответственно, оптимально для каждого шага иметь свою утилиту:

1) Выравнивание, резка - одна утилита. 2) Очистка от мусора - другая. 3) OCR - третья. 4) Перевод в djvu - четвёртая.

При этом получаем хорошую гибкость - можно прогнать любой этап 1-2-3 сколько угодно раз. Можно для любого этапа использовать лучшую программу. Можно вставить спец. улучшения - типа 10-20 прогонов CPCtool.

constRS
() автор топика
Ответ на: комментарий от Frolic

Товаришь Фролик, ты бы, того этого, если сам определить, где падает, не можешь, дай шанс другим. Напиши автору программы об ошибке, хотя бы.

Только не по-детски и не как менструирующая девочка, а нормально, как взрослые люди делают - спокойно, чётко и полно.

constRS
() автор топика
Ответ на: комментарий от constRS

>Выравнивание, резка - одна утилита

а почему бы тогда не завести для выравнивания и резки по отдельной утилите?:)

petrosyan ★★★★★
()
Ответ на: комментарий от petrosyan

Ну, ScanTailor так и организован - отдельные утилиты под одной крышей :-). Только связывание статическое, а не динамическое и не через вызов программы.

constRS
() автор топика
Ответ на: комментарий от x-com

> tiff+pdf будет получше.

+tiff -pdf

pdf - конетйнер для векторной графики и для отсканированных, но не распознаных книг не нужен.

LamerOk ★★★★★
()
Ответ на: комментарий от namezys

> Страшно что jpeg сделает с буквами. Он совсем для этого не предназанчен

Как ни странно, но ч.б. сканы значительно хуже масштабируются и смотрятся на экране, чем качественные грейскейл-сканы.

Я для комфортного чтения векторные пэдээфки раньше перегонял в битмапы, и джипег очень удачно "сглаживал шрифты".

LamerOk ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.