LINUX.ORG.RU

История изменений

Исправление proud_anon, (текущая версия) :

почему в некоторых случаях при копировании текста из pdf все вставляется нормально а в некоторых случаях какая-то абракадабра

Я всё пытаюсь разобраться досконально со внутренним устройством PDF, но не доходят руки.

Однако причина тут в том, что текст в PDF часто выводится встроенными шрифтами (а то и вообще вставлен в виде готового изображения), которые совпадать код-в-код с Юникодом. В твоём файле Evince находит 4 встроенных шрифта, в одном кодировка WinAnsi, в остальных - Custom. Видимо, PDF делался какой-то кривой программой, не поддерживающей Юникод, которая для отображения кириллицы заменила её на хрен знает что и соорудила шрифтов с соответствующими наборами символов.

Исходная версия proud_anon, :

почему в некоторых случаях при копировании текста из pdf все вставляется нормально а в некоторых случаях какая-то абракадабра

Я всё пытаюсь разобраться досконально со внутренним устройством PDF, но не доходят руки.

Однако причина тут в том, что текст в PDF часто выводится встроенными шрифтами (а то и вообще вставлен в виде готового изображения), которые совпадать код-в-код с Юникодом. В твоём файле Evince находит 4 встроенных шрифта, в одном кодировка WinAnsi, в остальных - Custom. Видимо, PDF делался какой-то кривой программой, не поддерживающей Юникод, которая для отображения кириллицы заменила её на хрен знает что и соорудила шрифтов с соответствующими наборами символовю