LINUX.ORG.RU

Конфертация ссылкок в html для локального просмотра

 , whet, , преобразование ссылок


0

1

Добрый День.

Есть html файлик, в нём есть много картинок. Все ссылки ведут в интернет. Нужно чтоб его можно было смотреть и без интернета. Да, можно открыть у себя апач сервер, и с помошью wgeta скачать на локальну. машину. Но открывать апач сервер для преобразования ссылок - жирновато. Есть и второй путь - написать скрипт, который регуляркой будет искать ссылки, преобразовывать их в локальные и создавать рекурсивно кучу подпапок как в домене. Но этот путь тоже не совсем приятен.

Идеально было-бы скормить wget html файл,чтоб wget его же выкачал и все ссылки преобразовал и сам создал эту кучу подпапок. В точности так, будто я открыл бы Апач сервер и сообщил бы вгету путь туда. Но wget отказывается воспринимать файл html как что-то, что нужно скачать. Как можно решить эту проблему?


Ответ на: комментарий от antares0

Кстати, а есть православный способ, если сайт сделан с особым умением и регистр в ссылках и в реальных файлах не соблюдён (win).
И после wget все ссылки битые?

anonymous
()
Ответ на: комментарий от antares0

Пасиб, каюсь - недочитал. Хоть wget при таком раскладе всё-равно не конвертирует ссылки внутри html документа. Или точнее - я не нашел нужных ключей. Но эту проблему решил питоновским скриптом ( регулярки).

def convert_links(txt,folder):
	# txt is text, where links will be converved ( string)
	# folder is folder where will be all media . Must be Short path
	out = re.sub("http.+\.vk.me",folder,txt)
	return out
Решение не универсальное, но для моих целей подходит. Усовершенствованная регулярка будет работать лучше.

vsrmis
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.