LINUX.ORG.RU

История изменений

Исправление stevejobs, (текущая версия) :

пишешь краулер, выкачанное краулером парсишь по необходимости соответствующими либами (если это PDF например - нужна жабная либа для работы с PDF), кладешь в какой-нибудь Splunk или Elasticsearch (считая каждый файл отдельным евентом?), ищешь, всё.

Исходная версия stevejobs, :

пишешь краулер, выкачанное краулером кладешь в какой-нибудь Splunk или Elasticsearch (считая каждый файл отдельным евентом?), ищешь, всё.