В общем, хочется странного.
Есть сервер, через который должны ходить пользователи (прозрачный http-proxy). И эти самые пользователи, конечно, любят отправлять всякие разные post и get данные. А серверы, на которые они ходят, отвечают им всяческими http-заголовками и собственно отдают html.
А хотелось бы контроллировать весь http-трафик. То есть берем какой-нибудь python+re+BeautifulSoup, пишем скрипт, и заставляем этот скрипт выполняться на любой чих (любой запрос) на наш прозрачный прокси. И каким-нибудь образом передаем нашему скрипту url и все данные (headers+html), чтобы он смог их потом обрабатывать. Ну, и так же хотелось бы, чтобы скрипт умел опознавать заголовок Content-Type, и запускался только для text/html, text/plain, text/xml, text/json, к примеру.
Понимаю, что нужно копать в сторону squid+squidguard, читал документацию, но так не представил, как это можно реализовать. Есть идеи?