LINUX.ORG.RU

Зеркалирование сайтов с кириллическими именами

 ,


0

1

Иногда я делаю копии мелких сайтов для прочтения в оффлайне. Обычно делаю это wget-ом, иногда нужен httrack.

Недавно родилась мода на кирилические имена сайтов и здравствуй глюк: «wget -mkp ... » качает какую-то левую фигню, потому что неправильно резолвит имя. Да, у сайта есть имя из латиницы и я попытался написать это имя сайта (латинскими), но оттуда меня переадресовывают на кирилическое имя и дамп обламывается.

HTTrack тоже не может дампить этот сайт (дампит одну страницу, при том ту же, что и wget). Вопрос не в том, как заставить wget сделать дамп, а можно-ли сделать дамп вообще?

В догонку - а как пинговать такие сайты? Или трассировать... Да как вообще работать с такими именами? Проблемка, в общем, глобальная. Прошу тех кто умеет - научите меня работать с «кириллическоимёнными» сайтами.

★★

На сайтах с кириллическими именами не может быть ничего полезного.

/thread

Deleted
()
Ответ на: комментарий от Deleted

Всё относительно, Михалыч...

На сайтах с кириллическими именами не может быть ничего полезного.

Смотря что считать полезным, верно?

zzdnx ★★
() автор топика
Ответ на: комментарий от Harald

А как проверить? У меня wget не собирался из сорца, я использую тот, что шёл в комплекте с ОС.

zzdnx ★★
() автор топика
Ответ на: комментарий от beastie

Попробовал использовать эту утилиту в обе стороны

Декодировал имя сайта из кириллицы и закодировал результат обратно. В итоге кириллицу не получил...

zzdnx ★★
() автор топика
Ответ на: комментарий от proud_anon

Батюшки...

И чего только на LOR`е не встретишь...

zzdnx ★★
() автор топика
Ответ на: комментарий от beastie

Да, этот кодирует/декодирует нормально.

Однако wget всё равно не делает дамп.

Скачивает одну HTML`ку несмотря на параметр "-mkp".

Внутри html`ки ссылки на имя сайта закодированы (не кириллица), но этого wget`у, видимо, мало...

zzdnx ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.