LINUX.ORG.RU

[html → pdf] Есть ли такое?


0

1

Доброго времени суток, ЛОР.
Имеется кучка html-ек, собранных с помощью wget -m. Хотелось бы сконвертировать всё это добро в один pdf-файл, да так, чтобы гиперссылки (которые внутренние, да и внешние тоже) оставались рабочими, ну и ШГ получаемого файла было приемлемо.
Было опробовано wkhtmltopdf, но оно почему-то не хочет принимать на вход несколько файлов (то есть, пришлось ещё файлы склеивать с помощью gs потом), ну и текст там совсем нигде не кликабельный.
Так вот, существуют ли решения для такого дела?

есть какой-то html -> png (на qt, надавно где-то на ЛОРе видел) а от туда можно конвертом в pdf.

Tanger ★★★★★
()
Ответ на: комментарий от ciiccii

Спасибо, попробую.

Ссылки кликабельны, но прийдётся скелеить pdf потом.


То есть, содержания с переходом на нужные страницы мне не ждать?

SoulThreads
() автор топика
Ответ на: комментарий от Tanger

> html -> png

Не вариант хотя бы по той причине, что там же текст уже не выделишь, да и с масштабированием беда будет.

SoulThreads
() автор топика

> Было опробовано wkhtmltopdf, но оно почему-то не хочет принимать на вход несколько файлов
Воспользуйтесь статической версией с офсайта, она использует пропатченный Qt и умеет это.

AITap ★★★★★
()
Ответ на: комментарий от ciiccii

Проверил xhtml2pdf — оно, конечно, работает, но, за исключением ссылок, от wkhtmltopdf почти ничем не отличается, разве что, картинки качеством хуже выходят.

Видимо, задача неразрешимая (или нереализованная) и придётся довольствоваться тем, что есть.

SoulThreads
() автор топика
Ответ на: комментарий от SoulThreads

>Видимо, задача неразрешимая (или нереализованная) и придётся довольствоваться тем, что есть.

Можно на файлы посмотреть, если это не секрет конечно?

anonymous
()
Ответ на: комментарий от anonymous

Да-да, этот файл у меня уже имеется, спасибо @Kim.
Интересует процедура получения такого файла, плюс чуть большая кликабельность текста (придирки, конечно). Ну и хочется решение в целом, а не только для данного случая.

SoulThreads
() автор топика
Ответ на: комментарий от SoulThreads

>Не LaTeX конечно, но вполне ничего, особенно если исходники немного причесать:

Ну, вот так приблизительно, с графикой:

http://www.onlinedisk.ru/file/668115/

А каким образом был получен этот файл?

См. выходные данные.

anonymous
()

Так же помимо всего здесь описанного можно воспользоваться и вот этими двумя способами:

- Вставка содержимого html страницы через буфер обмена в oowriter, или открытие сохраненного html документа через него же и затем выполнить «файл -> экспорт в PDF».
- Поставить виртуальный PDF принтер cups-pdf и отправить на него страницу на печать.

В обоих случаях ссылки сохраняться к тому же в первом случае можно указать добавить в pdf информацию о структуре данных, что предоставит более лучшую масштабируемость документа на разных экранах, к примеру при просмотре на электронной книге.

kostik87 ★★★★★
()
Ответ на: комментарий от anonymous

> См. выходные данные.

С помощью pdfinfo увидел, что документ этот сделан htmldoc'ом. Это оно?
А вообще, спасибо за старания.

SoulThreads
() автор топика
Ответ на: комментарий от SoulThreads

Посмотрел сейчас на htmldoc ­— да это же именно то, что и было нужно! Спасибо тебе, аноним, вопрос закрыт.

SoulThreads
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.