LINUX.ORG.RU

Преобразовать книгу в формате DjVu в PDF: вопрос по параметру -quality

 ,


0

1

Надо преобразовать книгу в формате DjVu в формат PDF. Для преобразования использую ddjvu из состава DjVuLibre.

ddjvu -format=pdf input.djvu output.pdf

PDF получается огромный, на несколько сотен мегабайт. И заодно ещё появляется предупреждение:

TIFFWriteDirectorySec: Warning, Creating TIFF with legacy Deflate codec identifier, COMPRESSION_ADOBE_DEFLATE is more widely supported.

Чтобы PDF получился меньшего размера, добавляю параметр -quality.

ddjvu -format=pdf -quality 85 input.djvu output.pdf

man ddjvu описывает его так:

-quality=factor: Enables lossy JPEG compression for TIFF and PDF files. This option only affects images that cannot be encoded using the preferred TIFF/G4 compression. Argument factor is a quantization factor ranging from 25 to 150. See command cjpeg(1) for more information on JPEG quantization factors. Value 80 is a good starting point.

Если я использую его со значением 100 или меньше, всё работает как надо и никаких предупреждений нет.

Но если ставлю значение больше 100, например 101 или 150, то то предупреждение снова появляется. Ни в man ddjvu, ни в man cjpeg объяснения почему так проиходит не нашёл. Кто-нибудь знает?



Последнее исправление: jsx (всего исправлений: 4)

Не работал с этим ублюдо-форматом, но по тексту у тебя внутри djvu тифы не кодируются, ты пробуешь с -q > 100, т.е. то что внутри djvu кодируется в jpg у которого по стандарту кач-во выше 100 не может быть, оттого и предупреждение.

А вообще это залупа какая-то. Распакуй djvu и конвертни сканы в pdf по уму.

Xant1k ★★
()
Ответ на: комментарий от Xant1k

Я не очень понял твою мысль, но мне кажется там история такая:

Если качество не указывать, то происходит примерно так:

djvu -> tiff-файлы с какими-то дефолтными параметрами -> pdf

Если качество указать и оно не выше 100, то так:

djvu -> jpeg-файлы -> pdf

А если качество указать, но выше 100, то так:

djvu -> tiff-файлы, предварительно преобразованные чтобы быть поменьше -> pdf

Потому что само это предупреждение - от LibTIFF.

jsx
() автор топика
Ответ на: комментарий от Xant1k

Не работал с этим ублюдо-форматом

К сожалению, многие книги в интернете именно в нём. Или, ещё хуже, в fb2.

jsx
() автор топика
Ответ на: комментарий от jsx

† в русскоязычном интернете

jsx
() автор топика
Ответ на: комментарий от jsx

Если качество не указывать, то происходит примерно так:

ТАК Я ТЕБЕ ПРО ЭТО И ПИШУ ЁМА-Ё

Xant1k ★★
()
Ответ на: комментарий от jsx

Если качество указать и оно не выше 100, то так:

Я ТЕБЕ И ПИШУ ЧТО ЕСЛИ ПАРАМЕТР КАЧ-ВО УКАЗАТЬ ТО БУДЕТ В JPG ПРЕОБРАЗОВАНИЕ. ЭТОТ КЛЮЧ (ПАРАМЕТР, КАК УГОДНО НАЗЫВАЙ) ТОЛЬКО ДЛЯ JPG.

Xant1k ★★
()
Ответ на: комментарий от Zhbert

Для сканов вообще строго говоря PDF/A, а не абы какой. Или TIFF-файлы. В библиотеке конгресса США вроде бы именно в них.

jsx
() автор топика
Ответ на: комментарий от Zhbert

Я его встречал только на «пиратских» русскоязычных сайтах. Больше нигде. Как и fb2, который вообще п-ц какой-то, но вся Флибуса в нём.

jsx
() автор топика
Ответ на: комментарий от jsx

А что не так с fb2? Читаю в нем книги уже года с 2010, как первую читалку купил, никаких проблем нет вообще.

Zhbert ★★★★★
()
Ответ на: комментарий от jsx

fb2, который вообще п-ц какой-то, но вся Флибуса в нём

И это прекрасно, потому что FB2 – Fiction Book, а не Tech или Science Book.

dataman ★★★★★
()
Ответ на: комментарий от Zhbert

Он мне не нравится тем что:

i) Под него мало приложений для чтения.

То есть да, они есть но:

1. В основном под Винду или вообще под какой-нибудь Pocket PC. Мне надо под макОС.

2. Старые; заброшены своими авторами. То есть, могут не работать нормально на свежих версиях ОС. Но впрочем, в силу первого пункта, это и не актуально.

3. Опенсорсных там всего три. Софт должен быть либо опенсорсным (и опционально свободным), либо вылизанным коммерческим. А все эти фриваре/донейшнваре - пусть идут обратно в свой 2003-й.

ii) Был создан специально для книг на русском языке. Считаю концепцию «региональных» форматов бредовой.

jsx
() автор топика
Ответ на: комментарий от jsx

Плюс полудохлая вики и ущербные конвертеры.

Короче, если у тебя программно-аппаратная читалка, и она нормально с ним работает, то он тебе конечно норм. А так вообще - треш трешовый, хрень с помойки.

jsx
() автор топика
Ответ на: комментарий от dataman

Я на лоре когда-то много сидел. Сейчас захожу раз в год, когда не могу найти ответ на других сайтах. И без реальной надежды его здесь найти, а просто время убить и/или выпустить пар. Реальных дельных советов и мнений здесь всегда было мало, а сейчас почти не осталось.

jsx
() автор топика
Ответ на: комментарий от jsx

Чтобы не быть голословным, поясню. Худлит - это не всегда просто простынь текста. И если формат работает только с простынями (а fictionbook, как я мог убедиться, заточен именно под это), то нафиг его.

jsx
() автор топика
Ответ на: комментарий от jsx

И нахерена отдельный формат под такие книги, отдельный под сякие итп. Если только заняться по жизни нечем.

jsx
() автор топика
Ответ на: комментарий от jsx

Ну вот буквально вчера читал книгу в нем, в которой есть картинки в тексте.

Zhbert ★★★★★
()

Эх, если б этот странный IW44 беспотерьно конвертировался в JBIG2…

token_polyak ★★★★★
()

Но если ставлю значение больше 100, например 101 или 150

А для чего ты ставишь его больше? ЕМНИП в жпега кволити в принципе не больше 100 же?

Вообще попробуй другим путем: распакуй дежавю в файлы, потом файлы, если нужно, пачкой конвертни в нужное тебе качество, потом уже запакой в пдф. Кажется, что так будет быстрее, чем разбираться с утилитой из поста.

Zhbert ★★★★★
()
Ответ на: комментарий от Zhbert

Я PDF предпочитаю. Мне нравятся страницы с фиксированным лайаутом. Мне приятно помнить, что заголок главы 5 расположен на 6 сантиметров от верха страницы такой-то. Не представялю как например Эдварда Тафти в HTML или EPUB читать.

Если в PDF книга не представлена, а представлена только в EPUB или DjVu, то ОК. Оба формата считаю ущербными, но терпеть готов.

Остальное вообще не рассматриваю. Но сборник Relics Пелевина нашёл давеча только в fb2. И тут-то меня и бомбануло.

jsx
() автор топика
Ответ на: комментарий от jsx

Не представялю как например Эдварда Тафти в HTML или EPUB читать.

Или, например, справчоник Мильчина и Чельцовой. По лэйауту он простой, но толстенный.

jsx
() автор топика
Ответ на: комментарий от Zhbert

А для чего ты ставишь его больше?

Да просто ради интереса. Они ведь пишут, что так можно. Но почему и зачем — пояснений не дают.

man ddjvu: -quality=factor: Enables lossy JPEG compression for TIFF and PDF files. <…> Argument factor is a quantization factor ranging from 25 to 150.

Вообще попробуй другим путем: распакуй дежавю в файлы, потом файлы, если нужно, пачкой конвертни в нужное тебе качество, потом уже запакой в пдф. Кажется, что так будет быстрее, чем разбираться с утилитой из поста.

Как вариант. Просто мне казалось (вероятно, какая-то ошибка восприятия), что та утилита - наиболее распространённый, а может и единственный ориентированный на интерфейс командной строки способ преобразования файлов в формате DjVu в другие форматы.

jsx
() автор топика
Ответ на: комментарий от jsx

Я согласен с тобой полностью. Техническую литературу я тоже предпочитаю в PDF читать как-раз из-за ее нормального вида в ней, а дежавю всегда бесил кривыми скриншотами и мазней вместо текста зачастую.

Zhbert ★★★★★
()
Ответ на: комментарий от jsx

Они ведь пишут, что так можно. Но почему и зачем — пояснений не дают.

Ну.. Выше головы-то не прыгнешь. Если изначальное качество хреновое, то как ни улучшай цифру оно таким и останется. Размер разве что вырастет.

Zhbert ★★★★★
()
Ответ на: комментарий от Zhbert

Как раз как аналогичную djvu компрессию втащили, так pdf всем стал удобнее.

Shadow ★★★★★
()
Ответ на: комментарий от jsx

мало приложений для чтения.
надо под макОС.

https://calibre-ebook.com/download

- не знаю, как, но оно даже под трансформерами самое удобное для ЧТЕНИЯ - встроенная читалка удобная как в киндле. Даже mobi словари поддерживает.

Shadow ★★★★★
()
Последнее исправление: Shadow (всего исправлений: 1)
Ответ на: комментарий от jsx

точно, я его для просмотра pdf ещё использую. У него какая-то либа шикарно растровые шрифты масштабирует - как-то пришлось читать продукт старого latex

Shadow ★★★★★
()
Для того чтобы оставить комментарий войдите или зарегистрируйтесь.