LINUX.ORG.RU

Локальная копия сайта. Скачивание целого сайта.


0

0

Допустим, скачан локально целый сайт. Но, так как часть контента сайта формировалась динамически, некоторые файлы имеют имена типа

/home/tupoiolen/site/www.zuzuz.com/?zuzu=3&bulka=2 /home/tupoiolen/site/www.zuzuz.com/?tratata=839&pupka=zizi

и ссылки на эти файлы в других файлах соответственно - эти же имена. Локально всё работает, по ссылкам можно ползать в броузере.

Но ссылки выглядят конечно криво и косо. Да и на другой сервер этот сайт не закачаешь - сервер будет не пропускать имена, рубать их по ?, думая, что это параметры запросов. В общем, не охота с этим возиться, хочется осуществить просто такую операцию:

Все файлы переименовать в нормальные имена, пускай даже случайные числобуквенные строки, кончающиеся на .html, но без этих следов динамического генёра.

И внутри всех html файлов соответственно исправить все ссылки и адреса до картинок.

Существует ли тулза, выполняющая задуманное мною, или же следует закурить маны по седам и грепам всяким, дабы написать злодейский велосипед на эту тему своими руками, который переименовывает файлы, затем ацки грепает по всему дереву в поисках ссылок, на переименованные файлы и исправляет их там?

Ответ на: комментарий от gustavo

> Существует ли тулза, выполняющая задуманное мною

Да, существует. Называется wget.

anonymous
()

Ключик -E у wget.

naryl ★★★★★
()
Ответ на: комментарий от gustavo

> Я и без вас его могу читать до просветления. То же мне, оригинальный совет )

Видать не снизошло таковое...

-m
--mirror
Turn on options suitable for mirroring. This option turns on recursion and time-stamping, sets infinite recursion depth and keeps FTP directory listings. It is currently equivalent to -r -N -l inf --no-remove-listing.

sin_a ★★★★★
()

man offline explorer

? заменяются в файлах символом ^ , то же самое в названиях

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.