LINUX.ORG.RU

Python Web-Scraping без сторонних библиотек возможно ли реализовать?

 


0

1

Всем привет! Я пытаюсь сделать веб-скрапер без каких-либо сторонних библиотек, возможно ли это реализовать только из стандартной библиотеки Python? Или все таки Beautiful Soup лучше?


BS в сотни раз более удобный чем стандартный html парсер питона. Так что если у тебя нет жестких ограничений мешающих взять BS - бери BS.

Aswed ★★★★★
()
Ответ на: комментарий от I-Love-Microsoft

При-чём это шаг вперёд (:

По теме: можно, но лучше BS (или что-то ещё)

MrClon ★★★★★
()
Ответ на: комментарий от deadNightTiger

Классная либа, судя по всему.

Но на сколько я понял, она не выполнит жиэс на странице, в отличии от фантома.

Deleted
()

Все сильно зависит от сайта. Некоторые удобно парсить BS, некоторые регулярками, а где-то нужено исполнение JS для формирования страницы. Так что под каждый сайт инструмент стоит выбирать отдельно, универсального нет. Точно есть - PhantomJS/ Selenium/puppetter, но они жрать будут на прядок, если не на два, больше.

Norgat ★★★★★
()
Ответ на: комментарий от deadNightTiger

Фантом стал не нужен после того, как в хромиуме сделали безголовый режим (имхо)

Скорее всего, да, так и есть. Просто с headless-браузерами я еще не работал.

Deleted
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.