История изменений
Исправление
Eddy_Em,
(текущая версия)
:
Чем автоматизировать обработку таких фотостраниц?
ImageMagic и скриптик a la
for file in `ls -1`
do
c44 $file
echo "File $file processed"
done
echo -e "Linking all... \c"
djvm -c book.djview *.djvu
echo "Done!"
rm *.djvu
mv book.djview book.djvu
А еще, если качество картинки хорошее, можно натравить на каждую страницу cuneiform. Вот, например, таким скриптиком я pdf-ки распознаю:
if [ $# == 0 ]; then
echo -e "\nUsage: $(basename $0) filename.pdf,\n\tneeds some space for temporary ppm-files,\n\tsaves results to file filename.txt\n"
exit -1
fi
NAME=$(bsnm $1)
# 1. Преобразуем pdf в ppm'ы
echo -e "\nConvert pdf to a lot of ppms"
pdftoppm $1 $NAME
# 2. Распознаем каждый рисунок
echo -e "\nRecognize every file\n"
for PPM in $(ls -1 ${NAME}-*ppm)
do
echo -n "$PPM .. "
cuneiform -l ruseng -f smarttext ${PPM} -o ${PPM}.txt
echo "done!"
done
# 3. Собираем все вместе
rm -f ${NAME}.txt
cat $(ls -1 ${NAME}-*txt) > ${NAME}.txt
# 4. Подчищаем мусор
echo -n "Ready, cleaning ..."
rm -f ${NAME}-*.txt ${NAME}-*.ppm
echo "Done!"
Исходная версия
Eddy_Em,
:
Чем автоматизировать обработку таких фотостраниц?
ImageMagic и скриптик a la
for file in `ls -1`
do
c44 $file
echo "File $file processed"
done
echo -e "Linking all... \c"
djvm -c book.djview *.djvu
echo "Done!"
rm *.djvu
mv book.djview book.djvu