LINUX.ORG.RU

gscan2pdf 0.9.20


0

0

Gscan2pdf - это небольшая графическая утилита для сканирования документов и изготовления из них PDF.
В новой версии комбинации клавиш ctrl-x, ctrl-c, и ctrl-v работают с буфером обмена, размер бумаги теперь можно задать вручную, изменены иконки, исправлен баг при попытки сканировать бумагу с размером, большим чем позволяет сканер.

Домашняя страница: http://gscan2pdf.sourceforge.net/
Скриншот: https://sourceforge.net/dbimage.php?i...

>>> Подробности

Неплохо, неплохо. Будем знать.

>исправлен баг при попытки сканировать бумагу с размером, большим чем позволяет сканер. Гыыыы :D Баг жжёт. Ошибочно слинковались с libtrava.so? Я тоже хочу сканировать предметы большего размера, чем позволяет сканер :)

JackYF ★★★★
()

Сканы надо хранить в djvu, а не pdf, а то монстры получаются.

djvu специально и предназначен для хранения сканированных документов. 

А скрипт, который перегоняет картинки в djvu не стоит отдельной программы. Я, например, себе для jpg и tiff такой слепил:

#!/usr/bin/perl -w
my $i = 0;
my @cmds = qw[ djvm -c output.djvu ];
foreach  ( <*.jpg> ) {
    m/(.*)\.jpg$/ ;
    system("c44", '-crcbfull', $1.'.jpg', $1.'.djvu');
    $i++;
    push @cmds, $1.'.djvu';
}
foreach  ( <*.tif> ) {
    m/(.*)\.tif$/ ;
    system("cjb2", $1.'.tif', $1.'.djvu');
    $i++;
    push @cmds, $1.'.djvu';
}
print "$i files renamed\n";
system(@cmds);
print "\n$cmds[2] created";

vadiml ★★★★★
()
Ответ на: комментарий от vadiml

забыл добавить -- тут используется djvulibre

vadiml ★★★★★
()
Ответ на: комментарий от vadiml

Классный скрипт! С твоего разрешения добавлю его себе в ~/bin Как его обозвать? Перечисли, пожалуйста зависимости, и свои данные, имя, отчество, всё что нужно, что бы я мог поместить их начале скрипта, как авторство. Если ты конечно не против :) Могу я этот скрипт распространять, использовать как GPL софт?

baaba ★★★
()

> при попытки

Did you mean:

три попытки

при попытке

ebonent ★★
()

По-моему, хорошая тулза :)

Как только будет свободное время, обязательно попробую :)

GFORGX ★★★
()

pdf для сканов.... Хорошая у людей трава была.

nu11 ★★★★★
()
Ответ на: комментарий от golub

> Чтобы в pdf не получались монстры, надо кодировать не в tiff, а в JBIG2. Google Books, например, хранит всё в pdf.

это надо рассказывать не мне, а тем кто создает таких монстров.

PS djvu это делает сам -- даже думать не надо

vadiml ★★★★★
()
Ответ на: комментарий от baaba

> Как его обозвать? Перечисли, пожалуйста зависимости, и свои данные, имя, отчество, всё что нужно, что бы я мог поместить их начале скрипта, как авторство. 

обзывай как хочешь, у меня tiff2djvu, скрип примитивный, пишется за 5 минут, если надо что-то добавить -- vadiml.xx-на-gmail.com

зависимости 2 -- perl и djvulibre.

здесь так же может пригодиться еще один -- поворачивать картинки. Некоторые для этого используют gimp, я -- ImageMagick-perl:

#!/usr/bin/perl -w
use Image::Magick;

my $i = 0;

my @fls = <*.tif>;
foreach my $fl ( @fls )     {
    $fl =~ /(.*)\.tif$/ ;  # mask for files
    print "$fl\n";
    my $img = Image::Magick->new;
    my $images=Image::Magick->new;
    $x=$img->ReadImage($1.'.tif');
    warn "$x" if "$x";
    $img->Label('Rotate');
    $img->Rotate(-90); # градусы для поворота
    push(@$images,$img);
    $images->Write($1.'.tif');
    $i++;
}
print "$i files renamed\n";

vadiml ★★★★★
()
Ответ на: комментарий от vadiml

Монстров, кстати, можно перекодировать, в т.ч. в djvu. PDF в таких файлах в принципе является контейнером, большой размер выходит из-за использования TIFF.

golub
()
Ответ на: комментарий от vadiml

> А скрипт, который перегоняет картинки в djvu не стоит отдельной программы.

А теперь напишите скрипт, который, как и gscan2pdf, будет распознавать текст и выравнивать отсканированные с перекосом страницы. Желаю удачи :)

AP ★★★★★
()
Ответ на: комментарий от vadiml

можно ещё предварительно убрать просвечивающие буквы (если забыл подложить чёрный лист)

#!/bin/sh
# Copyright (C) 2008, Roman V. Prikhodchenko <chujoii af gmail com>
# License: GPL v3 or later


# Scheme скрипт
script=" 
(define filelist)
(set! filelist (cadr (file-glob \"/home/chujoii/tmp/scan/*.jpg\" 1)))
(print  filelist)
(while (not (null? filelist))
           (let* ((filename (car filelist))
                  (image (car (gimp-file-load 1 filename filename)))
                  (drawable (car (gimp-image-get-active-layer image))))

             (plug-in-dog 1 image drawable 3.0 1.0 1 1)
             (plug-in-unsharp-mask 1 image drawable 12.0 10.0 32)
             (gimp-convert-indexed image 1 3 2 0 1 \"\")

             ;(file-jpeg-save 1 image drawable filename filename 1.0 0 0 1 \"\" 1 1 0 1)
             (file-tiff-save 1 image drawable (string-append filename \".tiff\") (string-append filename \".tiff\") 0)             
             ;(file-ppm-save 1 image drawable (string-append filename \".ppm\") (string-append filename \".ppm\") 0)

             (gimp-image-delete image))
           (set! filelist (cdr filelist)))
(gimp-quit 1)
"


# Запуск gimp с пониженным приоритетом
nice -n 20 gimp --verbose -i -s -b "$script"

chu_joii
()
Ответ на: комментарий от AP

>А теперь напишите скрипт, который, как и gscan2pdf, будет распознавать текст и выравнивать отсканированные с перекосом страницы. Желаю удачи :)

и получится gscan2pdf Который дергает sane, unpaper и gocr =)

geek ★★★
()
Ответ на: комментарий от geek

О.. за unpaper спасибо.

Кстати, а кто-нибудь умеет клеточки убирать с тетрадных листов? Сейчас уже не актуально, а во времена студенчества очень хотел такое.

Davidov ★★★★
()

Что-то у меня оно падает при попытке открыть какую-нибудь картинку (Fedora 8).

anonymous
()
Ответ на: комментарий от AP

>А теперь напишите скрипт, который, как и gscan2pdf, будет распознавать текст и выравнивать отсканированные с перекосом страницы. Желаю удачи :)

Под Линукс распозновалка приличная есть? А я не в курсе был.. :(

baaba ★★★
()
Ответ на: комментарий от AP

Распознавание текста -- это отдельная задача. Решается она криво и после распознавания надо часами сидеть и вычитывать материал, прежде чем им можно воспользоваться (если ты конечно не студент и тебе насрать на ошибки -- быстрее бы сварганить курсач). Для чтения же книг никакого распознавания не надо.

leonid
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.