LINUX.ORG.RU

корректный xml из html


0

1

Есть определенный (xpath) парсер xml, есть html-ка, которую надо отпарсить. по идее не должно было быть проблем, но на деле получается, что код хтмльки содержит феерическое количество несоответствий. пробовал «причесать» html-ку при помощи tidy — ничего не вышло, говорит:

Тhis document has errors that must be fixed before using HTML Tidy to generate a tidied up version.

Подскажите, может быть есть такая утилитка, которая бы выкинула все несоответствия, и приготовила хоть сколько удобоваримый хмl/xhtml-код?

★★★★★

Последнее исправление: Ingwar (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.