LINUX.ORG.RU

пищем google


0

0

Приветствую всех сочуствующих, а также примкнувщих.

предистория.
- через пару лет в ЦЕРНе стартует большая машина под назаванием LHC,
которая будет выдавать данные размером 12-14 PetaBytes в год.
Конечный пользователь (физик) будет работать с этими данными
ввиде mini-DST aka ROOT файлов. Пример здесь:
http://carrot.cern.ch/CarrotExamples/hsimple.root.

- вот тут-то становиться очень важен "учет и контроль".
Пользователь должен знать какая информация находится, где, и в
каких файлах.

"Традиционный подход" к решению этой задачи "прост" - создаем
файл каталог на основе realtional database.

Главный недостаток этого подхода - "некая статичность" и гипер-централизация.
При изменении любого файла, его перемешении, удалении и пр. -
все это должно отражаться в центральной базе данных. И Пользователь
должен информировать обо всех изменениях базу данных..
Есть и другие недостатки, но суть не в этом ...

проблема.
Хотелось бы иметь свой "google" "на уровне" одного сайта.
Т.е. иметь "blogger", crawler ... , который динамически отслежвает
"состояние", изменение сайта.

Зачем это нужно? Как видно из
http://carrot.cern.ch/CarrotExamples/hsimple.root?/3256058/ntuple;1/
ROOT файл - это просто набор HTML страниц.

Пользователям будет "позволено" менять, перемещать файлы
(в "web пространсве" ака между public_html subdirs) и пр.
"не информируя" об этом никакую базу данных.

База данных с помощью crawlera сама должна отслеживать эти
изменения.

Кто-нибудь сталкивался с решением подобной проблемы?
Заранее благадарю за любую помощь, ссылки.

Марк.

++
конечно, есть и другое применение всему этому -
динамическая репликация сайта.
Предварительное название проекта -
"ухо-горло-нос" или "анти-модератор" ;-)

Всем анонимным пациентам LORa - посвящается ;-)


ну и заплатите Google inc., они вам локальный поисковик соорудят лучше всякой поделки самопальной.

вообще вижу любят у вас в церне велосипеды городить

anonymous
()
Ответ на: комментарий от anonymous

> вообще вижу любят у вас в церне велосипеды городить

Например WWW нагородили. Вместо использования готовых решений по хранению данных от IBM.

m_m
()
Ответ на: комментарий от m_m

вообще конечно физиков можно понять -- намного спокойнее, зная только Си и фортран нагородить что-то доморощенное, чем обучаться чему-то новому. пускай оно будет кривое и страшное, зато свое.

вот уже и интерпретатор для Си++ сделали, и графическую библиотеку свою ваяют. проблема в том, что такие как carrot абсолютно уверены что все сделанное в cern - идеал, и значит больше ничего никому не нужно. прямо как бсдишники с софтапдейтами и журналируемой ФС -- орали в три горла что это никому не нужно, теперь когда все это появилось в бзде орут какой это руль неимоверный.

anonymous-0xce20
()
Ответ на: комментарий от Novel

> вообще вижу любят у вас в церне велосипеды городить

переформулирую вопрос:
"Не хочется городить велосипед. Подскажите чего-нибудь"

Спасибо. Марк

carrot
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.