LINUX.ORG.RU

Как парсить html/flash player

 , ,


0

2

Доброго времени. Есть ли у кого опыт парсить плееры. Есть список сайтов в основном с каталогами видео которые закрыты в плеере. *закрыты - без прямых ссылок или необходимо для каждого дальнейшего просмотра переключить на следующее. Примером будет любой сайт типа seasonvar и тд. Расскажите кто знает, как бы последовательно спарсить ссылки на файлы? Если есть вариант на python будет идеально.


youtube-dl в помощь (он на питоне, так что можешь его брать за основу или коммитить туда), где он умеет это делать. А в общем случае задача сложна, так как некоторые плееры режут фильм на кусочки и подгружают маленькими отдельными порциями, которые надо все вытянуть и склеить. При том алгоритм склейки может быть не тривиальным. Правильный вариант — открыть сайт в браузере с инструментом разработчика и посмотреть на вкладке сеть откуда и как что тянется. После чего ковырять код страницы и скриптов, которые могут его формировать. Раньше flashgot помогал почти всегда, но тормозила поменяла API для плагинов и теперь его аналога нет.

peregrine ★★★★★
()
Последнее исправление: peregrine (всего исправлений: 2)
Ответ на: комментарий от peregrine

я понимаю что в ручную это не такая сложная задача. Но представь ситуацию, если этих файлов 10000+. Думал вариант с селениумом но здесь тоже как то геморно.

q13
() автор топика
Ответ на: комментарий от peregrine

В общем написал скрипт на python (requests, bs, selenium) работает через раз так как вставки рекламы не всегда по урлу распознать можно но работает. Код ужасен((

q13
() автор топика
Ответ на: комментарий от q13

Посмотри на фильтры адблока, чтобы не жрать рекламу.

peregrine ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.