LINUX.ORG.RU

Поисковый движок для TXT


0

1

Добрый день.
Вопрос не совсем по теме.
Мне нужно решить задачу поиска аналогичных фрагментов текста в текстовых файлах txt.
Я нашел примерно то, что мне нужно называется «Поисковый движок»
http://www.solarix.ru/for_users/download_them/faind/query.shtml
Но данная утилита платная.
Мне нужен интеллектуальный поиск, т.е. что-то большее, чем просто регулярные выражения.
Если знаете аналогичные платные и бесплатные аналоги под любую операционку, то напишите, пожалуйста, ссылки на них или их названия.
Было бы очень здорово, если бы утилита была для MS Word’а.
Заранее спасибо.


Было бы очень здорово, если бы утилита была для MS Word’а.

Ты сам знаешь, куда тебе нужно очень-очень срочно валить

anonymous
()

При чем тут linux/opesource? Что значит интеллектуальный? Быть может glibc поможет?

thelonelyisland ★★★
()

Youra_P

Мне нужен интеллектуальный поиск, т.е. что-то большее, чем просто регулярные выражения.

man mysql fulltext

Youra_P

Было бы очень здорово, если бы утилита была для MS Word’а.

на винфаке спросите, я не в курсе.

drBatty ★★
()
Ответ на: комментарий от drBatty

За что люблю этот форум так это за ёмкие бесполезные ответы! Если нечего отвечать, то не пишите. Нафига мне mysql, если мне нужно в текстовом файле найти фразу или в нескольких файлах. Может лучше Оракл поставить? Там всяко полнотекстовый поиск лучше. Мне нужно, что-то типа команды grep, но по возможностям похожее на см. ссылку. Там и про интеллектуальность есть местами. С документами MS Word в Linux работать никак нельзя? Особенно с docx, который xml.

Youra_P
() автор топика
Ответ на: комментарий от Youra_P

Youra_P

Нафига мне mysql, если мне нужно в текстовом файле найти фразу или в нескольких файлах.

если вам regex'ов недостаточно, то это и есть «более интеллектуально». Вы таки почитайте, ЧТО вам советуют.

Youra_P

Может лучше Оракл поставить? Там всяко полнотекстовый поиск лучше.

может быть. я почём знаю?

Youra_P

Мне нужно, что-то типа команды grep, но по возможностям похожее на см. ссылку.

что, русским языком не умеете изъясняться? только ссылками?

Youra_P

С документами MS Word в Linux работать никак нельзя?

можно. можно их распаковать и загнать в БД. Насколько я знаю, так kdeшный непомук и работает. раньше он юзал mysql, сейчас какую-то НЁХ.

drBatty ★★
()

посмотрите Apache Solr.

hizel ★★★★★
()
Ответ на: комментарий от Youra_P

Linux работать никак нельзя? Особенно с docx, который xml.

То есть линукс тит ни при чем? Товарищи вам таки правильно направление указали.

anonymous
()

grep, sed

Мне нужен интеллектуальный поиск, т.е. что-то большее, чем просто регулярные выражения.

Например?
Уверен, что если ты более четко опишешь задачу, тебе дадут решения стандартными средствами.

Kroz ★★★★★
()
Ответ на: комментарий от Youra_P

Если нечего отвечать, то не пишите.

здесь всем всегда есть что ответить. на винфак!

anonymous
()
Ответ на: комментарий от Youra_P

нужно, что-то типа команды grep, но по возможностям похожее на см. ссылку.

мне нужен самолёт, но по возможностям похожее на подводную лодку

anonymous
()
Ответ на: комментарий от Youra_P

С документами MS Word в Linux работать никак нельзя?

Старые форматы doc конвертируются в текст программой antiword. Как она работает с docx — не знаю. В худшем случае можно распаковать zip-ом и парсить XML. Или просто прогнать его через 's/<[^>]*>//g'.

question4 ★★★★★
()
Ответ на: комментарий от question4

Старые форматы doc конвертируются в текст программой antiword.

catdoc же

vostrik ★★★☆
()

нужен интеллектуальный поиск, ...что-то большее, чем просто
регулярные выражения.

автор жжот!
доставило!

mumpster ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.