LINUX.ORG.RU

Free proxy list


0

1

Писал грабилки для сбора информации на определенных сайтах, столкнулся с проблемой на одном из этих сайтов. При большом количестве запросов к сайту, сайт просто банит на 30 минут по ip. Добавил в скрипт 7 прокси серверов, пустил их выбираться рандомно. Все равно со временем одну из проксей банят - как следствие другие начинают отрабатывать чаще и постоянно 5 из 7 проксей(примерно) находятся в бане.

Возможности завести еще свои прокси нет. Хотел использовать листинги ананимных прокси, благо их в сети хватает. Написал несложных скрипт который рповеряет работоспособность проксей и пишет их в БД.

Проблема в том что они работают очень медленно(если работают вообще). Скрипт проверки отрабатывает а через пару часов прокся уже еле пашет.

Может кто нить сталкивался с подобными задачами, хотелось бы услышать идее как решить проблему. Чисто теоретически, реализация в принципе не проблема.

Ответ на: комментарий от nnz

Tor не очень хороший вариант, так как в данной ситуации важна скорость работы.

Tor как вариант уже рассматривался, хотелось бы еще каких нибудь идей. А то у меня произошел какой то творческий кризис, воткнулся в эту проблему и в голову ничего не лезет=)

solarys
() автор топика
Ответ на: комментарий от solarys

>так как в данной ситуации важна скорость работы.

За скорость нужно платить.
Покупаешь несколько VPS'ок на разных хостингах, берешь на каждую десяток айпишников, поднимаешь на них прокси, и вуаля!

Ну а если на это денежек нет — забудь про скорость, и смирно юзай тор.

nnz ★★★★
()
Ответ на: комментарий от nnz

Судя по всему так и придется поступить, денежки может и есть, но не стоит оно того чтобы покупать что-то. Не такая важная задача.

solarys
() автор топика
Ответ на: комментарий от solarys

Как сказал оратор постом выше - нужно покупать либо прокси (если сайт держит много одновременных обращений, то можно очень быстро обращатся), либо IP (дорого, но если поискать, можно и очень дешевые варианты найти)

it-partizan
()

мне интересно, как проверить проксик. если скорость чекать - просто скачать через этот проксик веб-страницу и засечь время. а вот если чекать анонимность - то тут всё посложней. как написать скрипт, который чекает прокси на анонимность ?

Voviandr
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.