Никто случайно не баловался sed'ом или awk или не писал однострочники на перле который вырезает из входного потока всё что находится между символами '<' и '>' (вместе с самими символами) и вставляя символ перевода строки после каждого блока, отдельно обрабатывая блок начинающийся строки «<a» выводя из этого блока всё что начинается с 'href=\«' и заканчивающийся ближайшим символом '\»', а так же дополнительно не выводящий всё что находится между «<script» и ближайшим «/script>» ну может быть ещё парочки тегов типа «style» и других не содержащих осмысленный текст
если приглядеться то получится упрощенный аналог links работающий только со стандартными утилитами