LINUX.ORG.RU

История изменений

Исправление Eddy_Em, (текущая версия) :

Чем автоматизировать обработку таких фотостраниц?

ImageMagic и скриптик a la

for file in `ls -1`
do
    c44 $file
    echo "File $file processed"
done
echo -e "Linking all... \c"
djvm -c book.djview *.djvu
echo "Done!"
rm *.djvu
mv book.djview book.djvu

А еще, если качество картинки хорошее, можно натравить на каждую страницу cuneiform. Вот, например, таким скриптиком я pdf-ки распознаю:

if [ $# == 0 ]; then
    echo -e "\nUsage: $(basename $0) filename.pdf,\n\tneeds some space for temporary ppm-files,\n\tsaves results to file filename.txt\n"
    exit -1
fi

NAME=$(bsnm $1)

# 1. Преобразуем pdf в ppm'ы
echo -e "\nConvert pdf to a lot of ppms"
pdftoppm $1 $NAME

# 2. Распознаем каждый рисунок
echo -e "\nRecognize every file\n"
for PPM in $(ls -1 ${NAME}-*ppm)
do
    echo -n "$PPM .. "
    cuneiform -l ruseng -f smarttext ${PPM} -o ${PPM}.txt
    echo "done!"
done

# 3. Собираем все вместе
rm -f ${NAME}.txt
cat $(ls -1 ${NAME}-*txt) > ${NAME}.txt

# 4. Подчищаем мусор
echo -n "Ready, cleaning ..."

rm -f ${NAME}-*.txt ${NAME}-*.ppm

echo "Done!"

Исходная версия Eddy_Em, :

Чем автоматизировать обработку таких фотостраниц?

ImageMagic и скриптик a la

for file in `ls -1`
do
    c44 $file
    echo "File $file processed"
done
echo -e "Linking all... \c"
djvm -c book.djview *.djvu
echo "Done!"
rm *.djvu
mv book.djview book.djvu