LINUX.ORG.RU

Как сохранить веб страницу для оффлайн использования

 ,


0

3

Сабж, иногда хочется сохранить страничку для оффлайн использования, так как некоторые сайты пропадают, когда перестают быть интересны их авторам, или с самим автором что-то происходит, например hacktux.com канул в лету довольно давно, а когда-то там были хорошие штуки про bash написаны, давно-давно я их раскуривал, но потом сайт забросили и он умер. Чтобы такого не случалось, хочу сохранять некоторые странички оффлайн, лучше всего в firefox-е это как-то делать, но при печати в PDF едет оформление, сохранение же странички в html, как я понимаю, не докачивает скрипты всякие на js и прочие штуки вроде картинок. А хочется прямо надёжной оффлайн копии и не всего сайта, а только интересующей странички, потому что весь мусор что есть мне не нужен.

★★★★★

Может удобнее буде HTTrack или wget2?

SM5T001
()

не докачивает скрипты всякие на js

Если скрипт лоадится динамически по какому-то действию, то никак.

fulmar_lor
()
Последнее исправление: fulmar_lor (всего исправлений: 1)

есть вариант делать скрин страницы фф-шным скриншотелем

spawn_sp ★★★★
()
Ответ на: комментарий от ptah_alexs

В огнелисе был. Лет пять назад, правда.

Хз, почему от него отказываются, удобная штука для сохранения полезностей.

Zhbert ★★★★★
()
Ответ на: комментарий от peregrine

Если на странице скрипт вида (псевдокод):

<script>
const cdn = 'http://cdn.example.com/';
// ... some code ...
onPageLoad(() => loadScript(`${cdn}/important_script.js'));
</script>

то important_script.js должен как-то сохраняться, а строка ‘http://cdn.example.com/’ в коде подменяться на какой-то локальный путь? Мне кажется это не реально.

fulmar_lor
()
Последнее исправление: fulmar_lor (всего исправлений: 2)

Раньше был такой формат MHT, MHTML и MAFF (от Mozilla), но хипстеры сказали что всё это говно, висит мёртвым грузом и источает уязвимости, поэтому сохранение этих форматов выкинули изо всех браузеров. Скоро и поддержку просмотра выкинут.

// Вот прямо сейчас копаюсь в куче *.mht файликов, которые я сохранил браузером Opera на Presto и заботливо записал на диск в далёком 2007 году. Opera’ой же https://ftp.opera.com/ftp/pub/opera/linux/1216/ их и открываю. Всё прекрасно работает. Картинки, простенькие скрипты, CSS, анимации и ролики в одном файлике.

EXL ★★★★★
()
Последнее исправление: EXL (всего исправлений: 1)
Ответ на: комментарий от Zhbert

Нету уже. С переходом Firefox на новые рельсы отвалились все расширения. В Chrom{e,ium} галки, которые включали сохранение в формат MHT, тоже убрали.

EXL ★★★★★
()
Последнее исправление: EXL (всего исправлений: 1)
Ответ на: комментарий от deep-purple

Да ладно, что оно жс код анализирует? А если вот такое будет:

const cdn = `${scheme}://cdn.${appDomain}/`;

что оно будет с этим делать?

fulmar_lor
()
Ответ на: комментарий от fulmar_lor

Да. Страница уже построена, а все внешние ресурсы созраняются в папочку.

Ты что, из молодых смузихлебных поколений не видавших мхт? У меня также как у EXL валяется куча схронов страниц оффлайн в мхт.

deep-purple ★★★★★
()
Ответ на: комментарий от deep-purple

Если ты в скрипте переменную cdn не поменяешь, то можешь куда угодно насохранять этот скрипт, страница будет всё равно не к нему обращаться при загрузке, а будет лоадить его извне.

fulmar_lor
()
Ответ на: комментарий от fulmar_lor

<тут было очень много мата>, открой страницу в браузере, затем нажми Файл - Сохранить как.

deep-purple ★★★★★
()
Ответ на: комментарий от peregrine

Если вам страничку — wget -p.

httrack как раз для многостраничных сайтов, он и большие качает, просто очень долго.

fernandos ★★★
()

Offline Explorer (Wine+Gecko / Windows 7+ Updated).
Расширение UnMHT есть для Pale Moon, умеет в том числе множественное сохранение.

в PDF едет оформление

Я как-то сохранил тему с onanistov в pdf с помощью Otter, а там аватары и ники вправо почему-то переехали.

anonymous
()

Самое простое Ctrl + S в браузере.

Помню Opera 8 все ресурсы в одну кучу сохраняла. С 9 версии научилась нормально и даже MHT освоила. В том числе Opera была единственная, которая сохраняла изображения (обычно бэкграунды), прописанные в CSS. Лисий UnMHT до сих пор этого не умеет. И еще было удобно, что исходный URL в комментах MHT записывался.

anonymous
()

Страницу:

wget -nd -pHEKk
Сайт целиком:
wget -r -k -p -E -nc -l 0
Раздел сайта:
wget -r -k -p -E -nc -l 0 --no-parent

najlus ★★★★★
()

Ещё кстати картинки могут загружаться только когда к ним проскролили.

fulmar_lor
()
Последнее исправление: fulmar_lor (всего исправлений: 1)

Печатью в PDF файл же. Для Firefox'а есть расширения для более правильной печати в файл. Но лично мне больше нравится дефолтная печать в браузере Brave (который на основе Chromuim'а).

saahriktu ★★★★★
()

MozArchiver , ScrapBook X расширения.

anonymous
()

Юзать хром. Он умеет.

Legioner ★★★★★
()
Ответ на: комментарий от PolarFox

Может. Мне лень читать и разбираться как оно работает, но как-то оно сохраняет просто состояние страницы на момент сейва. Попробовал одну страницу на ангуляре написанную сохранить как mhtml - скрипты потом перестают работать, подозреваю, что оно не может восстановить состояние жс (значения в переменных, локал сторадж и т.п.).

fulmar_lor
()

Некоторое время назад задавался подобным вопросом и по итогам обсуждения лучшим решением оказался аддон SingleFile (есть и для хромога, и для фокса). Просто все сохраняет в один файл, картинки, вероятно, в base64. Работает хорошо, открыть можно в любом браузере. Все эти mht, maff и т.п. не кроссплатформенны.

Im_not_a_robot ★★★★★
()
Ответ на: комментарий от anonymous

PDF едет оформление

+сану формат бумаги А3 и в добавок пробовать «упростить страницу»

luckas
()

Мне даже пришлось залогиниться, чтобы ответь. Неожидал, что насоветуют миллион расширений на такую простую задачу.

Так вот расширения для этого не нужны. Достачно либо сделать полный скриншот страницы в develop tools браузера, либо распечатать страницу в pdf файл твоим виртуальным принтером, который у тебя по дефолту уже есть.

anonymous_sama ★★★★★
()

есть расширения на броузеры которые делают скриншот страницы в полный ее размер со автопроскроллингом вниз, просто делаешь пак картинок которые тебя интересуют, если хочешь потом можешь с этого пдф собрать.

anonymous
()
Ответ на: комментарий от anonymous

Как быть с гифками и прочим медиа? Я предпочитаю переводить всё нужное markdown и работать с данными посредством аутлайнеров, VNote, например, или QOwnNotes.

ptah_alexs ★★★★★
()
Ответ на: комментарий от anonymous_sama

скриншот страницы

А если у тебя потом будет монитор с другим разрешением, от масштабирования шрифты замылятся. Или ты сделаешь скриншот на нетбуке в 1024x768, а потом будешь это смотреть в 1920x1080. Анимация, выпадающие меню опять же теряются.

Тогда уж лучше видео с экрана записать. Когда я узнал, что ютуб стал отключать комменты, учитывая какой это сложный сайт, для спасения комментов (там могла быть полезная информация) на интересующих роликах, я просто прокручивал и записывал видео с экрана. Для начала в легкий mpeg2, а потом сжимал в x264. Ну это лучше, чем ничего.

ffmpeg -f x11grab -r 2 -s 1024x768 -i :0.0 -vcodec mpeg2video -q:v 2 -g 6 record.ts
anonymous
()

Специально для этого держу старый, дореформенный Palemoon с расширением Scrapbook.

Насохранялось 5 Гигов полезных страничек с поиском по тегам. Полёт нормальный.

anonymous
()
Ответ на: комментарий от deep-purple

MyTetra

А можно поподробнее? Я ни в доках, ни в самой программе не нашёл такой возможности

Fizzika ★★
()
Последнее исправление: Fizzika (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.