Положим есть файл xxx.html. В нем присутствуют ссылки на ресурс example.com типа "https://example.com/article1.xml". Как мне башем вытащить оттуда список этих ссылок? Ссылка может быть в любом теге или свойстве.
Пробовал sed, но он вытаскивать либо жадно либо всю встроку:
sed 's/^.*href="\([^"]*\).*$/\1/'