LINUX.ORG.RU

Нужен лёгкий fulltext search engine: для C++ приложения, чтобы умел в en/ru, бесплатный.

 


1

1

Посоветуйте сабж?

Необязательно чтобы прямо либой линковался (хотя весьма желательно), на худой конец можно и через сокет.

Я в курсе, что индустриальный стандарт де факто - elasticsearch, но это чёртова зверюга.

Lucene тоже на жаве. Жаву тащить в дистрибутив приложения категорически не хочется.

★★★★★

Последнее исправление: dimgel (всего исправлений: 2)

Я в курсе, что индустриальный стандарт де факто - elasticsearch, но это чёртова зверюга.

В Java/Node.js мире, в .NET и вообще под вендами его не котируют.

По твоей задаче вот например:

https://github.com/luceneplusplus/LucenePlusPlus

https://clucene.sourceforge.net/

alex0x08 ★★★
()
Ответ на: комментарий от einhander

Может и подходит, я просто впервые о нём слышу (в отличие от). Для того вопрос и задал. Пока что склоняюсь в пользу lucene++:

dimgel ★★★★★
() автор топика
Последнее исправление: dimgel (всего исправлений: 3)
Ответ на: комментарий от dimgel

Я довольно давно и часто использую программу поиска документов - recoll. Там как раз под капотом используется xapian. Кроме здоровенной базы в 50Гб и соответственно ее загрузки, других недостатков нет, ищет очень быстро. На меньших базах загрузка моментальная.

einhander ★★★★★
()
Ответ на: комментарий от einhander

50гб текста? Или документов с картинками и прочим?

У меня по почте notmuch ищет (это внутри xapian), ее гигабайт 15. Никаких задержек не замечал ни разу. Но собственно текста там малая доля, конечно.

akho
()
Ответ на: комментарий от akho

Где-то 2 Тб вордовский файлов, тхт, csv и pdf и всякого такого рода, плюс около 2 Тб всякой медиа типа чертежей, картинок и 3д моделей. База поиска всего этого занимает около 50 Гб.

einhander ★★★★★
()