LINUX.ORG.RU

uri unescaping


0

0

На html странице в кодировке utf8, ввожу некоторый русский текст и отправляю на сервер. Браузер этот текст при отправке соответствующим способом эскейпит. Например, из "а б в" получается "%D0%B0%20%D0%B1%20%D0%B2", т.е. на utf8 мало похоже. Как восстановить исходную строку на стороне сервера? Курил http://www.ietf.org/rfc/rfc2396.txt, но там по этому поводу весьма невнятно...

★★★★☆

Это utf8 и есть, только каждый байт закодирован своим шестнадцитиричным представлением с префиксом "%". %D0%B0 - это два байта буковки "а", %20 - это пробел (только один байт), ну и так далее.

Teak ★★★★★
()
Ответ на: комментарий от Teak

sergey@athlon:~$ echo -n "а б в" |iconv -f koi8-r -t utf8 |hd
00000000  d0 b0 20 d0 b1 20 d0 b2                           |п╟ п╠ п╡|
00000008
sergey@athlon:~$ 

получаем то же самое, только без процентов

Teak ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.