Есть html страница из которой нужно выдергуть данные вот примерно такого плана:
<td id="TableInfo12345" class="col123">Текст что нужно получить из таблицы</td>
Пытаюсь получить данные используя hxselect из пакета html-xml-utils
hxselect -c 'td[id="TableInfo12345"]' < file.html
Постоянно вываливаются ошибки, что тег такой-то не закрыт, не понятно откуда взялся другой тег. Ошибка на ошибке и ошибкой погоняет т.к. пасал сайт студент на коленке. Если использовать нормальную страницу где все поуму то ошибок нет. Вопрос: как правильно распарсивать из bash страницу html если ее сделали рукожопы?