LINUX.ORG.RU

конверсия pdf->ps->pdf и русская кодировка


0

0

Есть pdf, созданный pdflatex с \usepackage{cmap}. Копирование русского прекрасно работает. Теперь необходимо в этом pdf'е заменить одну из страниц на ее отсканированное изображение (с рукописным текстом). Делаю следующим образом (a.pdf -- исходный файл): pdttops a.pdf ---> получаю a.ps psselect 1-5 a.ps pp1.ps ---> pp1.ps содержит страницы 1-5 psselect 7-11 a.ps pp2.ps ---> pp2.ps содержит страницы 7-11 Далее собираю pdf снова командой gs -dNOPAUSE -sDEVICE=pdfwrite -sOutputfile=out.pdf pp1.ps p.ps pp2.ps где p.ps файл с отсканированной страницей. Получаю out.pdf, однако с уже неработающим копированием русского текста. Как это можно исправить? И есть ли альтернативный метод замены/вставки страниц в pdf? Спасибо.

anonymous

Попробуйте pdftk, а также pdfedit.

BigBiker
()

я обычно включаю картинки в латех.
и ещё поставь векторные шрифты cm-super.
Кстати, это вероятно из-за просмотрщика, ибо acroread всегда копирует текст без проблем. А вот xpdf - нет.

scyld
()

Спасибо! C pdftk все работает.

зы. Проблема не в смотрелке. pdflatex генерит нормальный pdf при использовании cmap (без cmap вместо русских букв при копировании получаются крякозябры). Т.е. зависит от способа генерации pdf. Конверсия pdf->ps->pdf инструментами psutils (или ghostscript?) приводит к тому, что русификация слетает... (использовался ghostscript 8.15.3). Можно это как-то поправить? Хотя теперь pdftk устраивает....

anonymous
()

Но все таки... Попробовал на другом компе (SUSE 10.0, ghostscript 8.15.0, локаль CP1251, кодировка исходного tex файла cp1251) - все нормально копируется из pdf и после обработки ghostscript'ом. У меня же (ghostscript 8.15.3, openSUSE 10.2, локаль UTF-8, кодировка исходного файла cp1251) после гостскрипта слетает русский. В чем может быть причина?

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.