Есть некий html, который, конечно, не проходит валидацию у xmllint и tidy. Чем можно превратить его в что-нибудь пригодное для обработки? Парсить регулярками не хочу.
Похожие темы
- Форум Есть ли альтернатива HTML Tidy, но более тупая? Просто переформатировать HTML. (2016)
- Форум Нестандартные атрибуты HTML (2012)
- Форум Как в Python можно распарсить блоки текста в строке? (2015)
- Форум HTML не проходит валидацию на validator.w3.org (2008)
- Форум [бебекод] А почему в бордах хранят сообщения не прямо в html? (2011)
- Форум Отпарсить... (2009)
- Форум [krita] король умер, так и не родившись (2010)
- Форум Кто-нибудь пробовал комбинировать REST API и стандартные HTML формы? (2017)
- Форум [Qt][развелось тут] QTextDocument и html (2009)
- Форум Обработка ссылок в Wicket (2010)