LINUX.ORG.RU
ФорумTalks

Для чего интересного можно применить распределённый интернет-паук?


0

1

Сейчас у нас есть распределённый паук, который ищет звуковые файлы и «обсчитывает» - вычисляет разные признаки, начиная со спектра в некоторой полосе частот. Конечная цель - искать звуки по разным признакам. Типа как картинки по признакам: http://labs.ideeinc.com/multicolr

Но это долгий проект и известным он не будет ещё долго. Параллельно с хождением паука по интернетам приобретаются данные, которые сейчас выбрасываются за ненадобностью - в конце-концов сам текст на страницах, ссылки на другие сайты, ссылки на картинки и т.п. и т.д.

Чем можно нагрузить вычислительную часть такого паука в отношении тех данных, которые сейчас не нужны? Например жил-был такой проект «убийца гугла» - majestic12, который, ясен пень, гугл никогда не убьёт, да и сама идея «убить кого-то» - не нужна(с), но ребята тосковали-тосковали да и начали торговать какой-то информацией с сеошниками. Что они им продают - незнаю.

Спасибо. peorg@jabber.org

★☆

Последнее исправление: kiverattes (всего исправлений: 1)

Там может быть информация, например, о жанре. Её можно сохранить, а потом строить всякие интересные корреляции.

SOmni ★★
()

Искать экстримизм и продавать в ФСБ? Искать нелицензионный контент и продавать в РАО? Наверное можно что-нибудь для рекламщиков придумать - типа на каких ресурсах в каком контексте чаще всего упоминаются их продукты или что-то типа того, но не факт, что они это купят.

bender ★★★★★
()

Сделать автоматический реверс-инжиниринг музыкальных файлов, и их перекомпиляцию. Полученные произведения выкладывать программой wput на какой-нибудь FTP под Creative Commons.

pacify ★★★★★
()

Сколько страниц в день загружаете?

pi11 ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.