С одного сайта нужно достать где то 1000 названий компаний. Я могу через рекурсивный wget скачать html страницы и потом пройтись по ним grep-ом. Но получается небольшой overhead, т.к. это можно сделать не скачивая себе страницы на пк.
Проблема заключается в том что
wget -O - http://site.com | grep регулярка
но
wget -r http://site.com | grep регулярка
Есть какой то хитрый способ?