LINUX.ORG.RU

Как индексировать файлы на локальном диске?


0

0

Что-то вроде гугля, но только чтобы оно работало в моей домашней директории? htdig с локальными файлами работать не хочет и start_url: file:///home воспринимает как имя http-сервера. Не понятно как заставить его индексировать файлы только с определенными расширениями (html,pdf,txt) и игнорировать все остальные. Также нет уверенности, что его можно заставить понимать русский.
У кого какой опыт есть в этом направлении?


Ответ на: комментарий от supaflyster

Спасибо, видимо это я и буду устанавливать. Смущает только зависимость от mono и gtksharp.

geekkoo
() автор топика
Ответ на: комментарий от anonymous

Спасибо, хотя это и японская программа, но ее тоже можно попробовать. ;)

geekkoo
() автор топика

Попробуй еще recoll, там можно явно прописывать какие(по типу) файлы индексировать. Поддержка доп. форматов делается bash скриптами. Написано на C++.

Не висит демоном -> не отслеживает изменения, но и не жрет оперативу. Imho для доков самое то.

YesSSS ★★★
()
Ответ на: комментарий от YesSSS

Спасибо, но recoll, насколько я понял - это просто QT-морда к xapian, который делает основную работу по индексации. Xapian - да, интересный движок.

>>Не висит демоном

Из упомянутых программ только beagle работает с демоном. Остальные - по крону...

geekkoo
() автор топика
Ответ на: комментарий от geekkoo

И в и тоге я остановился на namazu. Хоть там и документация вся на японском.

swish при выдаче результатов не дает контекста. Результат буквально состоит из одного имени файла.

Установку beagle я так и не осилил

Хорошего клиента к xapian я не нашел. Есть консольный - omega, но чтобы им пользоваться, его нужно долго обтачивать.

А у namazu подкупило наличие emacs-моды (так что можно запускать поисковик прямо из емакса) и tknamazu (tk морды). Последнюю пришлось немного подточить, чтобы она открывала файлы в новом табе mozilla/firefox. Но, что радует, оно оказалось вполне работоспособно без apache/tux.

geekkoo
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.