LINUX.ORG.RU

Вопрос чудесникам wget


0

0

Вопрос чудесникам wget

Есть линк на страничку с контентом для взрослых.

Необходимо - закачать все *.jpg - файлы размера больше 30 kb в отдельный каталог.
Картинки, грузящиеся с других хостов + картинки размером < 30 kb + не картинки - игнорировать.
Помогите эту задачу решить средствами wget.

Мне пока удалось добиться только этого - "wget -r -l 2 -P xxx http://www.... " - загрузить страницу полностью в каталог ~/xxx.

// неприличный ананимус

anonymous

wget -r -l (0 ?) -P xxx -A *.jpg <url> И наверное -np (не подниматься каталогами выше), или тебе весь сайт? по размеру ограничений нет и html все равно будет загружаться по умолчанию с других хостов ничего не грузится P.S. Но если странички через какой-нибудь javascript грузятся, то это не поможет.

Bolverk
()
Ответ на: комментарий от norden

Для тех, кто не понял.

Есть страница с порно.

Которая содержит thumblails (уменьшенные картинки), которые представляют собой ссылки на
картинки (jpg) реального размера. Плюс на странице море баннеров, рекламы и мусора.

Нужна команда, которая скачает с этой странички только картинки реального размера.
Определить то, что это картинка реального размера можно только одним образом -
по размеру - он должен быть больше 30 kb.

Зачем мне это нужно: набрать команду + адрес странички в консоли - гораздо менее хлопотнее
чем загружать страницу в браузере, открывать каждую картинку в отдельном табе и сохранять.

p.s. я думаю одним лишь wget-ом дело не решится - наверное придется закачать всё с указанной страницы,
после закачки проверить все файлы на размер и расширение (надо только jpg) и удалять то что не подходит.
Так что данный вопрос и к чудесникам shell.

// неприличный ананимус

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.