LINUX.ORG.RU

Выбор движка поисковика


0

0

чтобы выбрать? для запуска на домашнем ноуте :) поиск по одному сайту. более миллиона страниц. даже может быть полтора. или два. точнее, страниц ещё больше, но чтобы хотя бы мильён с копейками потянуть можно было :) требуется возможность переиндексации не "всего махом", а постепенная, различных частей сайта с различной частотой. да, для некоторых страниц потребуется авторизация. возможность пользовать прокси "искаропки".

вот. подскажите чего-нибудь по этому поводу, пожалуйста :) спасибо :)

мм... пользоваться гуглем или нифигандексом или чем-либо иным не позволяет расхождения в наших религиозных взглядах: они чтят роботс.техете

Arachnoid
() автор топика

lucene хорош, но требует памяти много

xapian ужасен..

>домашнем ноуте

>более миллиона страниц

ну-ну...

anonymous
()

Вот сейчас смотрю на Яндекс.Сервер (топиком ниже запостил), впечатлений от ЛОРовцев пока не было.

Как потестирую, может напишу сюда каков он.

it-partizan
()
Ответ на: комментарий от anonymous

>lucene хорош, но требует памяти много

спасибо. хотя странно, вроде про память про него сказано, что мягко.

>ну-ну...

понимаю :) однако ж, имеем только то, что имеем) может летом всё же добавлю мозгов :)

Arachnoid
() автор топика
Ответ на: комментарий от it-partizan

>Вот сейчас смотрю на Яндекс.Сервер (топиком ниже запостил), впечатлений от ЛОРовцев пока не было.

>Как потестирую, может напишу сюда каков он.

это было бы замечательно :-)

правда, боюсь, что для моих целей он всё же не подойдёт. Уважает ли он robots.txt ? сайт то не мой. а " модификацию; - изменение, декомпилирование, дизассемблирование, дешифрование и иные действия с объектным кодом Программы" лайсенс их запрещает(

Arachnoid
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.