Набросал тут за вечер. На основе wget --spider.
Бот - парсит html и проверяет не проиндексированы ли уже ссылки.
Кусок бота, который проверяет, чтобы сохраненные ссылки не повторялись.
Клиентская часть.
Короче, скачивается html странички, с помощью wget --spider и утилит для обработки текста выдергиваются ссылки, направляются в файл. Потом в этом файле, в цикле, каждая ссылка проверяется с другой, находятся одинаковые и файл редактируется. Код еще сыроват и полностью программа не заработала, но по отдельным частям проверял. Потом будет выдергиваться краткая информация о страничке и заноситься в индексы в два столбика - ссылка и описание. Вводим в клиенте искомое и выдается ссылка. Это все должно автоматически быть. ЧЯДНТ? Может чего посоветуете? :)
Похожие темы
- Форум [bash] простая дёргалка (2010)
- Форум [bash] Простой секундомер (2012)
- Форум Простая поисковая система по сайту (2013)
- Форум простой вопрос по bash (2015)
- Форум Простой скрипт на bash (2010)
- Форум Простой вопрос по bash (2009)
- Форум Подскажите в простом bash скрипте (2022)
- Форум Подскажите по простому скрипту bash (2024)
- Форум Поисковый спам (2021)
- Форум Поисковый движок (2010)