Недавно в интернете обнаружил интересную статейку: http://www.livejournal.com/community/ru_linux/343232.html
Престраннейшая вещь или Большой брат следит за тобой. Отлаживал сейчас веб сервер и обратил внимание на то, что каким-то образом робот Гугла (?) получает все те урлы, по которым я ходил. Поясню это логом:
gfgdfgs.mydomain.ru 194.54.150.2 - - [16/Jul/2005:09:25:33 +0400] "GET / HTTP/1.1" 404 1551 "-" "Mozill a/4.0 (compatible; MSIE 6.0; X11; Linux i686; en) Opera 8.01" gfgdfgs.mydomain.ru 194.54.150.2 - - [16/Jul/2005:09:28:50 +0400] "GET /blah.mydomain.ru/blah.sql HTTP /1.1" 200 69590 "-" "Mozilla/4.0 (compatible; MSIE 6.0; X11; Linux i686; en) Opera 8.01" gfgdfgs.mydomain.ru 66.249.66.73 - - [16/Jul/2005:09:28:03 +0400] "GET /robots.txt HTTP/1.1" 404 208 "- " "Mediapartners-Google/2.1" gfgdfgs.mydomain.ru 66.249.66.73 - - [16/Jul/2005:09:28:04 +0400] "GET /blah.maxidoors.ru/blah.sql HTTP /1.1" 200 69590 "-" "Mediapartners-Google/2.1"
194.54.150.2 - машина, с которой я захожу. gfgdsgs.mydomain.ru - несуществующий поддомен реального домена mydomain.ru , который обрабатывается Апачом. В каталоге /var/www лежат каталоги серверов. Соответственно, я проверял, можно ли будет набрав неправильный адрес добраться до их содержимово. И кто-то это сразу же проверял со мной. Могу лишь предположить, что Опера 8.01 каждый запрос отсылает куда-то к себе, после чего это отдается Гуглу и он таким образом получает новые страницы для индексации. Такое замечаю уже не первый раз, правда предыдущие разы робот не утруждал себя даже строкой UserAgent.
Вообщем, если будет интересно, то методы получения гуглом новых страничек можно исследовать детальнее.
Но, бля, неприятно как-то!
P.S. Вторым вариантом (не без оснований, но это паранойя) можно предположить перехват трафика. Но эту возможность я не собираюсь даже рассматривать, как паранойю, которой я заразился от нашего сисадмина.
UPD. Налево стучится Опера. Сволочь. Хоть бы спрашивала...