Есть определенный (xpath) парсер xml, есть html-ка, которую надо отпарсить. по идее не должно было быть проблем, но на деле получается, что код хтмльки содержит феерическое количество несоответствий. пробовал «причесать» html-ку при помощи tidy — ничего не вышло, говорит:
Тhis document has errors that must be fixed before using HTML Tidy to generate a tidied up version.
Подскажите, может быть есть такая утилитка, которая бы выкинула все несоответствия, и приготовила хоть сколько удобоваримый хмl/xhtml-код?