Требуеться
парсер который прожует HTML
и создаст из него dom модель
я на вскидку знаю 2 таких libtidy и libxml
возможно подскажете что-то еще ?
критерий выбора это скорость разбора
и умение нормально разбирать
HTML конченого вида который нагенерен
всякими быдлоскриптами, с незакрытыми
или неправильно закрытыми тэгами,
левыми кусками которые непонятно к чему относяться
и т.д.
в общем если кто-то плотно сталкивался
с подобными задачами раскажите пожалуйста
какие есть либы и какие у них преимущества\недостатки.
Ответ на:
комментарий
от anonymous
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум HTML DOM parser (2008)
- Форум parser html (2011)
- Форум Perl HTML DOM (2006)
- Форум Помогите с HTML::Parser (2005)
- Форум Ооочень странное поведение Simple Html DOM (2015)
- Форум Parser (2010)
- Форум parser (2006)
- Форум Opera && DOM (2008)
- Форум DOM XML (2004)
- Форум javascript DOM (2006)