LINUX.ORG.RU
ФорумTalks

[вещества][сотни лулзов] sicp.pdf

 


0

0

как известно, уже почти 2 года у меня на рабочей тачке валяется sicp.pdf

ради прикола решил посмотреть логи, дескать откуда народ ко мне ломится

больше всего, конечно было разной бредятины типа "фибоначчи" и "квадратный корень", но один запрос меня поразил до глубины души

здесь его и выкладываю в неизменном виде:

81.177.37.24 - - [09/Nov/2008:08:28:52 +0500] "GET /sicp.pdf HTTP/1.1" 200 3727842 "http://www.google.com/search?q=%EA%F3%ED%E8%EB%E8%ED%E3%F3%F1" ";"

декодить не буду - рука не поднимается. Лучше сходите по урлу.

★★★★

Прозреваю "кунилингус"

Fray
()

Сходил, лулзов не нашел; применил iconv, понял все, но почему-то уже было не смешно.

shimon ★★★★★
()
Ответ на: комментарий от svu

> Буза, видимо, до сих пор юзает 8-битные кодировочки...

Еще и богомерзкую CP1251 причем.

shimon ★★★★★
()
Ответ на: комментарий от svu

это кусок из логов. 8-битные кодировочки юзал тот, кто делал запрос, вестимо.

gr_buza ★★★★
() автор топика
Ответ на: комментарий от Yoda_The_Master

> Так что же это за слово, всё таки?

кунилингус

Cancellor ★★★★☆
()
Ответ на: комментарий от gr_buza

Возможно, вы имели в виду: кунили%D0ЅРіСѓСЃ ?

LamerOk ★★★★★
()
Ответ на: комментарий от svu

У меня почему-то все нормально. Мой юзерагент вам виднее.

madcore ★★★★★
()

Не факт, что на файл перешли именно с этой страницы. У себя на сайте тоже логи рефереров вел, там иногда какие только сайты не обнаруживались, и с некоторых ну точно не могло быть ссылки на мой сайт. Ну не могла она быть, например, на главной рамблера или фишек.

Думал, что глюк браузера, например, рядом в другой вкладке страница открыта была.

Впрочем, лулзов ситуации это не отменяет.

Dolfer
()

Неужели "Основы анального рабства"?

nikolayd
()

> декодить не буду

Кстати, интересный вопрос. Как декодировать дважды кодированное в utf-8?

LamerOk ★★★★★
()
Ответ на: комментарий от LamerOk

> Кстати, интересный вопрос. Как декодировать дважды кодированное в utf-8?

2 раза iconv. Параметры для -t перебирать в циклах.

question4 ★★★★★
()
Ответ на: комментарий от gr_buza

> после рекодирования :)

кунили%D 0ЅРіСѓСЃ ?

isden ★★★★★
()
Ответ на: комментарий от question4

В каком цикле? Изначальная однобайтная кодировка известна - ср1251.

Затем она дважды подверглась утифивосьмикации (см. мой пост и пост isen'а).

iconv как и enca требуют указания конечной кодировки, но конечной кодировки у нас нет - в обеих случаях корректной будет некая "binary" кодировка.

Т.е. "стандартного" средства деутифивосмьикации какбэ нет.

LamerOk ★★★★★
()
Ответ на: комментарий от LamerOk

> В каком цикле? Изначальная однобайтная кодировка известна - ср1251.

> Затем она дважды подверглась утифивосьмикации 
> (см. мой пост и пост isen'а).

> iconv как и enca требуют указания конечной кодировки, 
> но конечной кодировки у нас нет - в обеих случаях корректной 
> будет некая "binary" кодировка.

> Т.е. "стандартного" средства деутифивосмьикации какбэ нет.

Не пойму в чём проблема. -f — начальная кодировка, -t — конечная.

$ echo кунилингус | iconv -f cp1251
кунилингус

$ echo кунилингус | iconv -f utf-8 -t cp1251
кунилингус

Перебор в цикле предлагал для случая, когда возможных кодировок несколько.

question4 ★★★★★
()
Ответ на: комментарий от question4

Забыл уточнить: если кодировка не указана, подразумевается основная системная кодировка. У моём случае — utf-8.

question4 ★★★★★
()
Ответ на: комментарий от question4

> Не пойму в чём проблема.

Да, ты прав, проблема была не в утификации, а в урл-кодировании.

echo кунили%D 0ЅРіСѓСЃ | iconv -t cp1251 -f utf-8
кунили%D 0�гус

LamerOk ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.