LINUX.ORG.RU

Phantomjs. Спрошу на всякий случай

 , ,


0

1

Есть скрипт, написанный на PHP, который парсит сайт. В новой версии сайта много информации теперь генерируется яваскриптом. Переходить на Phantomjs?

Ранее я уже им пользовался и остался очень доволен, но все же хочу уточнить, может кто знает альтернативы, чтобы обойтись без переписывания PHP кода.

PHP не знаю, поэтому по альтернативам подсказать не могу (можешь погуглить по запросу php headless browser).

С phantomjs (если не считать одного раздражающего бага) опыт положительный.

theNamelessOne ★★★★★
()

на самом деле любой жс можно «спарсить» и «выполнить», проведя небольшое аналитическое исследование. но зачем платить больше, если информации не так много, фантом вам в руки, или каспер, или что там есть еще

trashymichael ★★★
()
Ответ на: комментарий от trashymichael

У голого PhantomJS низкоуровневый API и никакой автоматизации пользовательского взаимодействия со страницей: нельзя просто заполнить форму или кликнуть на элемент страницы. На StackOverflow некоторые так и пишут, что проще посмотреть, с какой функцией связана какая-нибудь кнопка и вызывать её, чем обеспечивать нажатие на кнопку.

CasperJS поверх Phantom JS предоставляет эти функции, но отнимает REPL. И для обоих приходится писать код в виде callback'ов.

А Selenium Web Driver обеспечивает API, предназначенное для автоматизации действий пользователя с браузером. В коде просто описывается поведение пользователя на странице; не нужно копаться в том, как страница устроена - только лишь выбрать селекторы для интересующих элементов.

Другое дело, что удобнее всего, когда Selenium Web Driver управляет Фантомом: последний ради headless browser, первый ради API.

anonymous
()
Ответ на: комментарий от anonymous

похоже я попутал с каспером, а разве у фантома нет нормальных апи? может быть я не прав, не спорю

trashymichael ★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.