LINUX.ORG.RU

Îáúå


0

0

как это перекодировать во что-то читаемое?
и что это за метод кодирования?

★★

& # 2 0 6 ; & # 2 2 5 ; & # 2 5 0 ; & # 2 2 9 ;
это

MaR ★★
() автор топика
Ответ на: комментарий от Camel_Toe

латинские буквы меняет на русские и ещё чё только не делает, а "&#xyz;" игнорирует, так и оставляет, да и ограничение там 50 кб, а у меня около 400

MaR ★★
() автор топика
Ответ на: комментарий от Bod

а тут вобще нажимаю "расшифровать", кнопка становится серой (не доступной) и больше ничё не происходит

MaR ★★
() автор топика
Ответ на: комментарий от lodin

# iconv qwe -t latin1 | iconv -f cp1251
& # 2 0 6 ; & # 2 2 5 ; & # 2 5 0 ; & # 2 2 9 ; & # 2 3 1 ; & # 2 2 8 ; & # 2 3 7 ; & # 2 2 4 ; & # 2 5 5 ;

(с пробелами чтоб браузер не перекодировал)

MaR ★★
() автор топика
Ответ на: комментарий от opensuse

> фигня, не перевел мне бНОПНЯ`у

Всегда считал, что Лебедев - мудак..

Bod ★★★★
()
Ответ на: комментарий от MaR

> & # 2 0 6 ; & # 2 2 5 ; & # 2 5 0 ; & # 2 2 9 ; & # 2 3 1 ; & # 2 2 8 ; & # 2 3 7 ; & # 2 2 4 ; & # 2 5 5 ;

Объездная

Но пробелы нужно убирать.

Bod ★★★★
()
Ответ на: комментарий от opensuse

http://www.charset.ru/ уже лучше, но опять совсем не то, из xml файла сделал это:

&lt;xml version=&quot;1.0&quot; encoding=&quot;utf-8&quot; standalone=&quot;yes&quot;?&gt;<br /> &lt;kml xmlns=&quot;http://earth.google.com/kml/2.0&quot;&gt;<br /> &nbsp;&nbsp;&lt;Folder&gt;<br /> &nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;Waypoints&lt;/name&gt;<br /> &nbsp;&nbsp;&nbsp;&nbsp;&lt;Placemark&gt;<br /> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;name&gt;GAI&nbsp;&nbsp;1&lt;/name&gt;<b r /> &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&lt;Point&gt;<br />

MaR ★★
() автор топика
Ответ на: комментарий от MaR

вобщем есть xml файл, где текст такой, надо из него сделать обычный, даже не обязательно из 1251 в кои8 или ещё во что, главное чтоб небыло &#

MaR ★★
() автор топика
Ответ на: комментарий от MaR

Короче это quoted percent (или как там она называется).
Но автоматически перекодировать весь файл у меня почему-то не получается..

Bod ★★★★
()
Ответ на: комментарий от MaR

Что-то я не нашел в нем этого. По-идее может recode, но у меня с параметрами не срастается. Если есть венда, можешь попробовать эту чудную программку
http://softsearch.ru/programs/180-405-shtirlic-download.shtml

Под вайном она с таким объемом не справляется.

Bod ★★★★
()
Ответ на: комментарий от graynder

почти... но это именно в юникоде т.е. Îáúå реально Ã.áúå

MaR ★★
() автор топика
Ответ на: комментарий от MaR

Это имхо 1251. А в заголовке файла стоит указание на юникод.

Bod ★★★★
()
Ответ на: комментарий от MaR

$ echo Îáúåçäíàÿ Càìàðû|iconv -f utf-8 -t latin1|iconv -f cp1251
Объездная Cамары

...

Если видишь сплошной ряд умляутов - то это обычно cp1251 показанный в виде latin1.

KRoN73 ★★★★★
()
Ответ на: комментарий от KRoN73

очередной косяк, встречаются символы типа "& # 3 3 5", т.е. больше чем 255 и ни во что кроме utf8 не конвертируются, как их можно проигнорировать? т.е. надо cp1251

MaR ★★
() автор топика
Ответ на: комментарий от MaR

>очередной косяк, встречаются символы типа "& # 3 3 5", т.е. больше чем 255

А это уже должен быть как раз юникод. То, что не влезло в latin1 браузер при POST/GET'е записал в виде HTML-сущностях.

Т.е. сперва раскодируем всё, кроме сущностей в юникод, потом раскодируем сущности.

KRoN73 ★★★★★
()
Ответ на: комментарий от kilolife

wgetом не пробывал, написал скрипт для перекодировки и игнора некоторых символов, в результате проблема решилась, всем спасибо

MaR ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.