LINUX.ORG.RU

recursive http download, utf8


0

0

Мда. Я-то думал, что в XXI веке все нормально работают с уникодом. Ан нет. Единственное(?) человеческое средство работы с рекурсивным http - wget - показывает утф8 жирный кукиш (о чем есть официальная бага). Не справляется урлы c последовательностями вида %D0%95 сохранить в правильные уникодные имена файлов, там получается просто каша. В результате - не могу скачать каталог с файлами.

Чем бы таким это дело осуществить?

★★★★★

подозреваю что чем-то на php, используя urlencode() и подобные. хотя можно и на sh такое написать, и с вгетом юзать совместно.

Komintern ★★★★★
()
Ответ на: комментарий от anonymous

В некоем месте лежат некие мп3 файлы, с русскими именами (что неудивительно, музыка русская). Урлы вполне корректные - там могут и должны быть эти % - но wget должен их правильно обрабатывать. А он гад!

svu ★★★★★
() автор топика

> Единственное(?) человеческое средство работы с рекурсивным http - wget

Есть ещё как минимум httrack и Getleft. Правда не знаю, как у них с юникодом. Относительно последнего - не уверен что живо.

lord_pnevmoslon
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.