Я тут небольшое сравнение $subj написал, с сугубо практической точки зрения. Beagle, Google, Recoll, Strigi, DocFetcher, Tracker и Pinot.
Правда, написано по-английски, но вдруг кому поможет:
Desktop search engines compared: http://dmatwork.blogspot.com/2009/11/desktop-search-engines-compared.html