навеяно этой Почему блокируется краулер? темой. Многим нужен мониторинг отдельных страниц avito да и других сайтов, постоянно сталкиваюсь с этим. А если такой способ вообще без обращения к сайту?
Вкратце звучит так: получаем кэш гугла и записывается контент куда нибудь в переменную потом периодически сравниваем то что у нас уже есть и то что в кэше если не изменилось то ничего не делаем, а вот если изменилось то вычисляем что изменилось на нужных нам страницах. Такие сайты как авито индексируются довольно часто и задержка будет небольшой. Будет работать такой способ как думаете? Главное что не надо обращаться непосредственно к сайту с его защитой. Гугл тоже вроде не будет против это ведь не SERP а кэш