LINUX.ORG.RU

Быстрая БД для агрегаций и работы с простейшими данными

 , , ,


0

2

Данные представлены в виде столбцов 5, по сути: несколько строк и чисел с плавающей точкой.

Основная задача - хранить сотни миллионов записей с возможностью нестрогого полнотекстового поиска по ним с возможностью агрегации по числовым столбцам.

Мне в голову пришло использовать mongodb, так как полнотекстовый поиск там как-раз нестрогий и, кажется, шустрый. Но смущает объём данных и скорость фреймворка агрегаций.

Я в монге хранил до 20млн живых записей, одноуровневых, обычные запросы работали шустро, достаточно. Но сейчас разговор идёт о сотнях миллионов.

Было предложено использовать Oracle, но я его не использовал и всё, что вижу в сети - он шустрее монги в агрегациях, но про поиск бенчмарков не нашёл и провести сейчас не могу.

Может у кого будут советы какую БД использовать? Какие могут быть проблемы с монгой? Чем же хороша Oracle или привыкли?


Ответ на: комментарий от erzent

Перечитал его сообщение, зато с монго уже есть опыт.

А для ТС'а. Если есть деньги - тогда оракл. Про такое говно как XE забудь сразу, только EE. ИМХО, конечно, но ставить 1 базу стенделоном как-то хреновенько. Нужно настраивать датагард, нужно рманом правильно делать бекапы, с очисткой архивлогов. При установке еще нужно будет много чего настроить под себя, начиная с тейблспейсов. Но сама жара пойдет, когда у тебя начнут валить ошибки типа ORA-06553, тогда вешайся. И это вообще, самый минимум, долго описывать даже как ее просто поставить и более-менее настроить, а за возможности поднастройки я вообще молчу.

Ставить с помощью хауту в инете - забей сразу, половина не рабочие изначально, половина бредовые, найти правильный гайд будет сложно. Да и нужно уметь хорошо курить оф документацию.

В общем, опять ИМХО, но выбирай оракл, если есть бабки. На официальную поддержку, которая стоит дофига в год, можно забить. За последние 2 года еще ни разу не писали в нее, все решали своими силами. Лучше брать саппорт у аутсорсеров, желательно со статусом платинового партнера, так будет дешевле. Просто если бы вдруг у тебя что-то сломается, выдерут не по-детски.

kukara4 ★★
()
Последнее исправление: kukara4 (всего исправлений: 2)
Ответ на: комментарий от EvgGad_303

Фу, грязный ентерпрайз, латентные гомосеки и унылая проприетарщина. Надеюсь мы наставили ТС'а на путь только хардкорного опенсорса :)

kukara4 ★★
()
Ответ на: комментарий от kukara4

О, спасибо большое! Сейчас понимаю что объёмы и нагрузки будут не такие, так что пока хватит монги. Но про оракл надо будет всё изучить, тему эту я и правда совсем не знаю.

tia
() автор топика
Ответ на: комментарий от tia

ты лучше смотри на будущее, разрабатывать сразу под оракл дешевле получится, чем переводить потом, большие объёмы данных.

erzent ☆☆
()
Ответ на: комментарий от tia

Без проблем, я с ораклом не по-наслышке дело имею, так что если что, обращайся, помогу чем смогу. Тут еще есть дбашники хорошие, своих не бросаем :)

kukara4 ★★
()
Последнее исправление: kukara4 (всего исправлений: 1)
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.