LINUX.ORG.RU
ФорумAdmin

Вопрос по закачке информации


0

0

Уважаемый All. Подскажите, ибо сам не знаю. Есть сервер, с которого надо скачать информацию (в идеале создать копию на локальном диске с исходной структурой каталогов) только начиная с определенного подкаталога и ниже по уровням (например адрес http://www.tralyalya.org надо собрать все с http://www.tralyalya.com/docs и ниже по каталогам в нем). Страницы на php писаны. ссылки на документы (*.txt) в страницах по адресу типа http://www.tralyalya.com/doc.php?p01=0ac1f20, то как не скачавая эти страницы слить только сами документы, _*все*_? А если потом просто проверять их обновление.... то вообще класс был бы....В wget'е ниче не получается, он или никуда не лезет кроме первой страницы или льет все че ненадо. Сами ссылки на документы в пхп структуризированы - есть страница с каталогами, каждая ссылается на додгруппу и потом на документы - уровней пять получается. Подскажите плизззззззз!!! Не дайте сдохнуть не познавши! Бо меня за эту подборку сношают, а качать несколько тыщь доков руками больно гоморойно :(

anonymous

боюсь, что это просто невозможно. скорее всего документы генерятся из базы, и линки на них появляются согласно идентификаторам в базе.

anonymous
()
Ответ на: комментарий от anonymous

Не помогло, хотя все равно большое спасибо. Я тут уже в воскресенье нарисовал парочку перловых скриптиков, которые "рассосали мой геморой". Но все равно, спасибо тем кто откликнулся :)

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.