История изменений
Исправление
stevejobs,
(текущая версия)
:
пишешь краулер, выкачанное краулером парсишь по необходимости соответствующими либами (если это PDF например - нужна жабная либа для работы с PDF), кладешь в какой-нибудь Splunk или Elasticsearch (считая каждый файл отдельным евентом?), ищешь, всё.
Исходная версия
stevejobs,
:
пишешь краулер, выкачанное краулером кладешь в какой-нибудь Splunk или Elasticsearch (считая каждый файл отдельным евентом?), ищешь, всё.