К примеру, по моему сайту прошлись каким-то веселым сканером и в логах осело много интересного вроде:
GET /invalid../../../../../../../../../../etc/passwd/././././././././././././././././././././.
GET /?f=unexisting/../../../../../../../../../../windows/win.ini.\x5C.\x5C.
GET /index.php?pid=12345&showtopic=12345&st=0%26%27%20or%20%28sleep%284.4%29%2b1%29%20limit%201%20--%20
(конечно, никакого index.php на сервере и в помине нет)
Но дело не в этом. На сайте есть функционал, который долбится к чужим ресурсам и пытается получить с них данные, пользователь может запостить ссылку вида «example.com/index.php?id=2‘; DROP TABLE login; #», бот пойдет по такой ссылке и поломает чужой сайтик. Ну или пойдет постить запросы как выше. Когда разгреб свои логи, то сильно задумался, что меня могут использовать в роли прокси вот для таких гадостей.
Выпиливать фичу жалко (бот проверяет отпощенные ссылки), думаю сделать словарик вроде «DROP », «etc/passwd» - если в ссылках есть такие слова, то бот по ним не пойдет. Остается вопрос - где найти таких слов для блеклиста?