Есть ли что-нибудь готовое, чтобы могло:
- проиндексировать каталоги на диске.
- при индексации искать текст в куче форматов (plain text, html, doc, odt, fb2, внутри архивов и т.д), определять при этом кодировку (utf-8, utf-16, cp866, cp1251, koi-8)
- работать достаточно быстро, быстрым я считаю индексацию хотя бы со скоростью 20-30 Мб/сек на 2-х ядерном более-менее современном компе.
- уметь быстро добавлять к индексу новые файлы.
- искать с учетом морфологии русского языка в проиндексированном.
- удобно показывать результаты поиска, например выводя куски текста с подсветкой того, что искал.
- и чтобы это работало локально и очень желательно не требовало превращать свой комп в web-сервер.
- грабить корованы.
Впрочем последний пункт можно опустить :)