gumbo-parser и beatifulsoup

0

1

есть beautifulsoup для питона, который парсит html и xml

и есть либа на Си с биндингами для питона - gumbo-parser, которая для использования требует внешний модуль, например beautifulsoup - насколько я понял
https://github.com/google/gumbo-parser

так вот, можете вкратце сказать зачем нужен этот гумбо-парсер, если Суп и так умеет парсить хтмл?

Ссылка

←	Запрет удаления софта в Android

Молния: нужен простой и лёгкий видеоредактор

→

В супе вроде парсера нет же, только обёртка над ним для сахара. По умолчанию он lxml кажется использует, но можно подсунуть любой.

Kalashnikov ★★★
(21.08.13 18:55:27 MSK)

Ответ на: комментарий от Kalashnikov 21.08.13 18:55:27 MSK

Ну вот простейший пример использования: soup.find_all('a') — получить все ссылки со страницы.
Документация - http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Если это не парсинг html, то что?
Вот и я не пойму, зачем ему внешний парсер? Или пока не поставишь gumbo/lxml/.. - это все не работает? Тогда зачем вообще нужен beautifulsoup?

sergey-novikov ★★★
(22.08.13 17:14:24 MSK) автор топика

Ответ на: комментарий от sergey-novikov 22.08.13 17:14:24 MSK

Ну а до параграфа Installing a parser по своей же ссылке ты не дочитал? Без супа ты бы парсил так.

Kalashnikov ★★★
(22.08.13 17:39:55 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	Запрет удаления софта в Android

Desktop

Молния: нужен простой и лёгкий видеоредактор

→

Похожие темы