LINUX.ORG.RU

Как отсканировать растровый DjVu и перевести в векторный PDF?

 , , , ,


0

2

есть книга — «Цифровая обработка сигналов. Практический подход». На просторах интернета она встречается лишь в djvu, т.е. растровый формат. книгу я бы хотел читать на отдельной читалке, которая не умеет нормально масштабировать растровые файлы, поэтому хотелось бы перегнать в pdf текстом.

собственно, вопрос: как лучше всего перегнать djvu в pdf? по самостоятельному поиску я не нашёл особо вариантов, так что если у кого был опыт — прошу поделиться.

зы: бумажная версия книги стоит две тысячи, так что лучше попробовать сначала это. также возможно есть пдфы оригинала на английском но, боюсь, у меня так будут проблемы с некоторыми терминами



Последнее исправление: dikey0ficial (всего исправлений: 2)

Ответ на: комментарий от foxy_ant

Объем правок будет сравним с написанием книги с нуля. Пока сконвертируешь - три раза прочитаешь. И пдф будет не нужен.

utanho ★★★★★
()

В djvulibre есть набор утилит по работе с djvu.

Для работы с pdf есть утилита pdftk.

По сути тебе нужно написать скрипт, который разберёт файл в формате djvu на отдельные страницы, конвертнет каждую в pdf и потом соберет из отдельных pdf страниц один pdf файл.

kostik87 ★★★★★
()
Ответ на: комментарий от kostik87

нужно написать скрипт, который разберёт файл в формате djvu на отдельные страницы, конвертнет каждую в pdf и потом соберет из отдельных pdf страниц один pdf файл.

Не все так просто! Автор же хочет не картинки перегнать из djvu в pdf, а получить текст и уже его загнать в pdf. Растровые картинки в pdf точно также плохо маштабируются! Поэтому - только через ОСР.

sigurd ★★★★★
()
Последнее исправление: sigurd (всего исправлений: 1)

Найти таки в Яндексе эту же книгу как хороший векторный PDF. Она там есть.

https://forum.vegalab.ru/attachment.php?attachmentid=421781

Пятый результат по запросу "цифровая обработка сигналов практический подход" pdf.

AEP ★★★★★
()
Последнее исправление: AEP (всего исправлений: 1)

в djvu обычно есть текстовый слой. он аккурат создавался под условия когда совместно хранится и растровое изображение и распознанный текст. спробуй его выковырять.

pfg ★★★★★
()
Последнее исправление: pfg (всего исправлений: 1)
Ответ на: комментарий от utanho

Да, повозиться придется, но это не переписать книгу вручную. У ТС наверняка будет еще задача перенести в PDF таблицы, графики и пр. книга ведь не художественная.

foxy_ant ★★
()
Ответ на: комментарий от pfg

По закону подлости высшей справедливости как раз в этом DJVU-файле не будет текстового слоя.

foxy_ant ★★
()
Ответ на: комментарий от foxy_ant

но это не переписать книгу вручную

Как минимум половину текста. Вычитывать его надо весь и не раз. Таблицы и графики полностью делать или получится полное г.

utanho ★★★★★
()
Последнее исправление: utanho (всего исправлений: 1)
Ответ на: комментарий от utanho

Посмотрел по ссылке выше PDF-версию книги, там достаточно формул. На этом OCR-система споткнется.

P.S. Топикстартеру пора пометить вопрос как решенный.

foxy_ant ★★
()
Ответ на: комментарий от dikey0ficial

Посмотрел, советую таки читать в оригинале. Или читать параллельно перевод и оригинал. В переводе я нашел довольно много ошибок и опечаток, которые можно списать на невнимательность переводчиков. Платить за такую халтуру, разумеется, не стоит.

Пример: на странице 107, «Для сигма-дельта-модуляторов, порядок которых больше двух, для борьбы с настойчивостью используют специальные конфигурации.»

Имелось в виду «для борьбы с неустойчивостью».

AEP ★★★★★
()
Последнее исправление: AEP (всего исправлений: 2)
Ответ на: комментарий от Im_not_a_robot

будет Ад и Россия

Это намёк, что русские избранный народ?

no-such-file ★★★★★
()
Ответ на: комментарий от Im_not_a_robot

Точно по ТЗ, разбиваем файл на страницы, векторизуем растр в inkscape и перегоняем в pdf. Собираем из многих pdf один файл. Pdf векторный, но ТСу не поможет.

einhander ★★★★★
()
Ответ на: комментарий от AEP

Еще в задаче 3.5 на странице 190 невозможная формула.

Никакой это не практический подход, а переусложненная и замудренная теория. Читать надо совсем другую книжку: https://dspguide.com/ (PDF'ы качаются по главам, ссылки: http://www.dspguide.com/CH1.PDF .. http://www.dspguide.com/CH34.PDF)

AEP ★★★★★
()

бумажная версия книги стоит две тысячи

Говорят у русских экономика страдает, нет надежды. Прикинь ты книгу напишешь и можешь рассчитывать что отчисления капают. Для пиратов писать не очень хочется. Наверно поэтому многие хотят куда-то в более цивилизованное место уехать, где платят, стандарты соблюдают.

Купишь книгу - проявишь уважение к автору и труду и отрасли 💪

читалке, которая не умеет нормально масштабировать растровые файлы А что получается? Хуже чем билинейная интерполяция? Или плохо DJVU читает? Можно djvu в pdf перегнать.

DanilaZabiakaa
()
Ответ на: комментарий от DanilaZabiakaa

Прикинь ты книгу напишешь и можешь рассчитывать что отчисления капают. Для пиратов писать не очень хочется.

я тоже считаю, что авторам надо платить и цены на книги оправдываются этим (в большинстве случаев), но оригинальная версия этой книги была выставлена в свободный доступ самими авторами, так что я считаю, что в данном случае имею право пользоваться.

А что получается? Хуже чем билинейная интерполяция?

в принципе не масштабирует большие (размером в страницу) картинки. Digma r654, если что

dikey0ficial
() автор топика

djvu в pdf переводят в растровый, причём, с похожей технологией. А OCR это боль.

Shadow ★★★★★
()

На просторах интернета она встречается лишь в djvu, т.е. растровый формат. книгу я бы хотел читать на отдельной читалке, которая не умеет нормально масштабировать растровые файлы, поэтому хотелось бы перегнать в pdf текстом.

Если там есть текстовый слой то не понимаю в чем проблема и зачем pdf, читалка лучше переварит epub. Если нет то через OCR, т.е. фактически никак потому что неизбежные ошибки сделают чтение очень некомфортным.

mbivanyuk ★★★★★
()
Ответ на: комментарий от DanilaZabiakaa

Говорят у русских экономика страдает, нет надежды. Прикинь ты книгу напишешь и можешь рассчитывать что отчисления капают. Для пиратов писать не очень хочется. Наверно поэтому многие хотят куда-то в более цивилизованное место уехать, где платят, стандарты соблюдают.

Купишь книгу - проявишь уважение к автору и труду и отрасли 💪

В данном случае не согласен. Проявляется уважение не к автору, а к горе-переводчику и редколлегии, которого они не заслуживают. И спасибо пиратам, что они дали мне возможность это узнать.

P.S. Файл стер.

AEP ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.