LINUX.ORG.RU

История изменений

Исправление sudo-s, (текущая версия) :

ксо. для тех, кто ниасилил конвееры, поясняю алгоритм:

1. curl'ом взять HTML как текст (так устроен curl)
2. этот текст пропарсить перл-скриптом, получить на выходе ссылки (так устроен перл-скрипт)
/*для того, чтобы получить ссылку, по ней НЕ ОБЯЗАТЕЛЬНО проходить, она прописана в коде страницы, (так устроен html), нужно лишь регэкспами отсечь все лишнее в строке с "onclick" (так устроены регэкспы).*/
3. эти ссылки вывести в stdout или в файл. если нужно по ним пройти (для статистики, скажем) - запускается баш-скрипт, который последовательно (так устроен баш) берет по одной ссылке и запускает браузер с параметром, например, "links2 http://linux.org.ru/" и браузер открывает эту страницу (так устроены браузеры). А потом выполняет kill для этого браузера, что его закрывает (так устроен Unix), после чего (так устроены ЭВМ) выполняется следующая инструкция, т.е. запуск браузера по новой ссылке (так устроены параметры). 
Итог: мы имеем 2 несложных скрипта на БАШ и Перл. У нас есть файл со всеми ссылками со страницы (или отсеянные по какому-либо критерию), имеем проход по каждой из ссылок с данного IP. Разве это не замечательно?

Исходная версия sudo-s, :

ксо. для тех, кто ниасилил конвееры, поясняю алгоритм: 1. curl'ом взять HTML как текст (так устроен curl) 2. этот текст пропарсить перл-скриптом, получить на выходе ссылки (так устроен перл-скрипт) /*для того, чтобы получить ссылку, по ней НЕ ОБЯЗАТЕЛЬНО проходить, она прописана в коде страницы, (так устроен html), нужно лишь регэкспами отсечь все лишнее в строке с «onclick»* (так устроены регэкспы)./ 3. эти ссылки вывести в stdout или в файл. если нужно по ним пройти (для статистики, скажем) - запускается баш-скрипт, который последовательно (так устроен баш) берет по одной ссылке и запускает браузер с параметром, например, «links2 http://linux.org.ru/" и браузер открывает эту страницу (так устроены браузеры). А потом выполняет kill для этого браузера, что его закрывает (так устроен Unix), после чего (так устроены ЭВМ) выполняется следующая инструкция, т.е. запуск браузера по новой ссылке (так устроены параметры).

Итог: мы имеем 2 несложных скрипта на БАШ и Перл. У нас есть файл со всеми ссылками со страницы (или отсеянные по какому-либо критерию), имеем проход по каждой из ссылок с данного IP. Разве это не замечательно?