Доброго всем времени суток!
Для получения списка ссылок на все страницы сайта использовал в скрипте
lynx -crawl -traversal
Пример подобного скрипта: http://www.kompx.com/en/lynx-browser-creating-sitemap.xml
но выяснилось с httpS такая конструкция напрочь отказывается работать, например:
lynx -crawl -traversal -accept_all_cookies "https://www.yandex.ru/"
lynx: Start file could not be found or is not text/html or text/plain<br>
Exiting...