опять wget

0

0

Ребята, не пинайте за, возможно, глупый вопрос.

Стоит такая задача. Скачать все файлы http://blablabla/blabla/*.mp3

Нужно, чтобы wget скачал их все рекурсивно, докачиавал при множественных обрывах связи, после перезагрузки компа, вёл лог.

Чтение мана пока не помогло, я новичёк.

Заранее спасибо!

Ссылка

←	редактировать SRT субтиры

Шрифты

→

Из мана, нащёл сразу:

>You want to download all the GIFs from a directory on an HTTP server. You tried wget http://www.server.com/dir/*.gif, but that didn't work because HTTP retrieval does not support globbing. In that case, use: wget -r -l1 --no-parent -A.gif http://www.server.com/dir/

-o lof.file -для лога опция.

marsijanin ★★
(31.07.07 00:03:19 MSD)

Ответ на: комментарий от marsijanin 31.07.07 00:03:19 MSD

Я так уже пробовал, говорит что не найден index.html и вываливается с ошибкой 404.

anonymous
(31.07.07 01:30:08 MSD)

1. в чистом виде это не возможно
2. если сервер показывает содержимое http://blablabla/blabla/ как каталог, то wget -r -l1 --no-parent -A.mp3 http://blablabla/blabla/
3. на mp3real.ru архив нахаляву, и нинадо парить себе мозги.

generatorglukoff ★★
(31.07.07 01:32:24 MSD)

Ответ на: комментарий от generatorglukoff 31.07.07 01:32:24 MSD

Если в браузере набрать http://blablabla/blabla/ то сайт говорит, что такой страницы нету. Однако, файлы http://blablabla/blabla/file.mp3 качаются на ура, но опять таки браузером (для нужно щёлкнуть по ссылке на другой странице сайта). Проблема в том, что там этих файлов сотни и щёлкать я буду до второго пришествия (а если учесть, что не было ещё и первого, то это очень долго :))

Неужели нет решения этой проблемы? Может есть какая другая продвинутая качалка, которая это умеет?

anonymous
(31.07.07 01:52:10 MSD)

Ответ на: комментарий от anonymous 31.07.07 01:52:10 MSD

> Может есть какая другая продвинутая качалка, которая это умеет?

man curl

grad
(31.07.07 02:32:53 MSD)

Ссылка

Ответ на: комментарий от anonymous 31.07.07 01:52:10 MSD

Если есть страница сайта, на которой указаны ссылки, то сохрани эту страницу в файл, а потом скорми это файл wget через опцию '-i'.

mky ★★★★★
(31.07.07 09:53:47 MSD)

Ссылка

> Чтение мана пока не помогло, я новичёк.

Наглая ложь.

birdie ★★★★★
(31.07.07 10:39:17 MSD)

Ссылка

Ответ на: комментарий от anonymous 31.07.07 01:30:08 MSD

>Я так уже пробовал, говорит что не найден index.html и вываливается с ошибкой 404.

Давай ссылку на ту чудо-страницу - интереса ради попробую.

Bebop ★★
(31.07.07 11:21:17 MSD)

Ответ на: комментарий от Bebop 31.07.07 11:21:17 MSD

Вобщем хочу скачать все аудио архивы музпросвета http://radio.super.lv/

Все mp3 файлы скачиваются по ссылкам вида: http://radio.super.lv/files/Muzprosvet_N258_2007.07.21.mp3

Читал также man curl - не помогло.

anonymous
(31.07.07 12:29:11 MSD)

Ответ на: комментарий от anonymous 31.07.07 12:29:11 MSD

качай лучше nasamomdele.org

NoName ★
(31.07.07 20:30:35 MSD)

Ссылка

Ответ на: комментарий от anonymous 31.07.07 12:29:11 MSD

Я может щас жоска спалюсь, но уже чертовски позно и у меня каша в голове... В общем, похоже напрямую никак... НО, я бы сделал следующим образом: у них там все по выпускам (или как оно зовется) - ссылки вида http://radio.super.lv/node/571 а внутри есть ссылка на мп3. Вот и предлагаю тягать их именно так...

В итоге имеем конструкцию от которой мне сделалось грустно

curl http://radio.super.lv/node/571 | wget -q -c -r -nH --no-parent -A.mp3 --force-html --domains=http://radio.super.lv/ --cut-dirs 11 -l1 -i -

все это еще заворачиваем в цикл подставляющий в curl все возможные номера выпусков.

Если есть желание смотреть на километровые портянки стоит убрать -q в wget. Но оно таки качает.

ЗЫ Я спать пошел...

Bebop ★★
(01.08.07 01:48:41 MSD)

Ответ на: комментарий от Bebop 01.08.07 01:48:41 MSD

Думаю понятно, что в приведенном примере команды номер выпуска 571?

Bebop ★★
(01.08.07 01:49:58 MSD)

Ссылка

Ответ на: комментарий от Bebop 01.08.07 01:48:41 MSD

Мдя, вот я наколбасил... при таких раскладах можно проще: сначала curl адрес_выпуска, потом грепаем на предмет нужных ссылок с mp3 (регекспы нужны) и скармливаем wget-у и в цикл все это.

А то как я написал будет сильно дергать сервера на том конце.

Bebop ★★
(01.08.07 12:39:30 MSD)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	редактировать SRT субтиры

General

Шрифты

→

Похожие темы