Похож на regexp, но оперирует не символами строки, а HTML-«сущностями» - тегами, атрибутами.
HTML-документ рассматривается как линейная последовательность тегов с атрибутами. Текст между тегами - это тег TEXT, атрибут DATA которого равен самому тексту.
Позволяет описывать шаблоны из HTML тегов и операции извлечения данных из атрибутов найденных тегов найденных шаблонов.
https://sites.google.com/site/pavelkolodin/tt
Базовое описание на английском, внизу дана демка.
Спасибо.