LINUX.ORG.RU

gumbo-parser и beatifulsoup


0

1

есть beautifulsoup для питона, который парсит html и xml

и есть либа на Си с биндингами для питона - gumbo-parser, которая для использования требует внешний модуль, например beautifulsoup - насколько я понял
https://github.com/google/gumbo-parser

так вот, можете вкратце сказать зачем нужен этот гумбо-парсер, если Суп и так умеет парсить хтмл?

В супе вроде парсера нет же, только обёртка над ним для сахара. По умолчанию он lxml кажется использует, но можно подсунуть любой.

Kalashnikov ★★★
()
Ответ на: комментарий от Kalashnikov


Ну вот простейший пример использования: soup.find_all('a') — получить все ссылки со страницы.
Документация - http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Если это не парсинг html, то что?
Вот и я не пойму, зачем ему внешний парсер? Или пока не поставишь gumbo/lxml/.. - это все не работает? Тогда зачем вообще нужен beautifulsoup?

sergey-novikov ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.