LINUX.ORG.RU

Получить произвольную страницу в браузере и обработать через JavaScript

 cross-domain, ,


0

1

... без использования юсерскрипта и проксирующего сервера.

Вопрос. Есть ли возможность в браузере получить HTML-код (или XML-объект) страницы по произвольному URL и обработать через JavaScript?

Например, нужно в браузере через JavaScript получить код страницы:

https://yandex.ru/search/?text=привет

Каким образом это можно сделать?

Задача предельно простая.

Но читаю интернет и поражаюсь: похоже, что такого действия в браузере сделать нельзя. Какие-то дикие ограничения: сервер, куда обращается JavaScript, должен находиться под вашим контролем, там вы должны разместить на отдаваемых страницах поддержку postMessage HTML5 или реализацию JSONP, или вы должны сделать на сервере тупой PROXY, или включить на сервере CORS. Но я же не могу этого сделать на yandex.ru.

Может быть, есть какое-нибудь таки решение? Пускай извратное, типа побайтной реализации HTTP протокола на JavaScript через websocket или что нибудь наподобе?

Рассмотрю так же решение с PROXY, если в нем будет понятно как избежать бана PROXY-сервера со стороны поисковика при слишком частых запросах. Поэтому хотелось бы «распределенного» решения, которое просто работает из браузера пользователя.

★★★★★
Ответ на: комментарий от invokercd

ёпрст, напиши простой сервер на python/node/whatever и отдавай json-ом со своего домена. Работы на 10 минут.

Это не проблема.

Просто после N-го количества запросов поисковик перестает отдавать контент. Просит капчу с предупреждением.

Xintrea ★★★★★
() автор топика
Ответ на: комментарий от Xintrea

Ну тогда нужно юзать платные сервисы от поисковиков, или делать LB кластер из серверов.

invokercd ★★★★
()
Ответ на: комментарий от Xintrea

Просит капчу с предупреждением.

Удивительно! Вот же они жадные скоты!

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.