key-value storage с объемом порядка 50-100 терабайт

0

1

Нужно провести некоторые вычисления, для которых требуется key-value хранилище строка-строка (первая строка 50-100 байт, вторая 10 килобайт), общий объем будет составлять порядка 50-100 терабайт, затем в случае успешного расчета постоянно хранить эту базу данных для обращений к ней. Интересуют варианты о том, как это лучше и дешевле сделать. Я вижу такие варианты:

S3, выходит порядка $10k в месяц
пока неизвестно, но возможно, что данные будут хорошо сжиматься. Тогда можно создать архив с оглавлением (например, zip), в котором будут файлы, имена которых есть ключи и писать в этот архив/читать из него, архив держать на инстансе EC2 с большим количеством дискового пространства.
дешевле купить свое железо? какое?

Ссылка

←

хочу еще

Это интересно: ученые советуют заряжать мобильные телефоны мочой

→

Яндекс- гугло- дропо- диск. Только придется индусам за декапчу заплатить.

soomrack ★★★★★
(27.07.13 00:52:47 MSK)

Ответ на: комментарий от soomrack 27.07.13 00:52:47 MSK

Хм, а где почитать про капчу и лимит запросов дропбокса? Вот куплю я у них подписку за $750 в год, и буду через апи создавать/читать миллиард файлов по 10 килобайт (пишут же, что объем без ограничений)? Или что-то этому все же помешает?

Deleted
(27.07.13 00:58:37 MSK)
Последнее исправление: Deleted 27.07.13 00:59:24 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 27.07.13 00:58:37 MSK

redis, consistent hashing для кластеризации, можно его же использовать как БД, если не нужны сложные запросы-выборки.

Dantix ★★
(27.07.13 01:02:01 MSK)

Ответ на: комментарий от Deleted 27.07.13 00:58:37 MSK

читать миллиард файлов по 10 килобайт

пинг, допустим 100 мс * умножаем на миллиард, конец немного предсказуем

Dantix ★★
(27.07.13 01:03:15 MSK)

Ответ на: комментарий от Dantix 27.07.13 01:03:15 MSK

Число потоков же неограничено.

Deleted
(27.07.13 01:04:56 MSK)

Ссылка

Хотя не, с редисом это опрометчиво сказал, столько ОЗУ за сколько-нибудь вменяемые деньги ты врядли найдешь.

Dantix ★★
(27.07.13 01:05:18 MSK)

Ссылка

SAS hdd стоит 300$ за 3 ТБ. Итого - 10К, грубо говоря, покрывают твои 100ТБ. Только надо как-то организовать эти 30 дисков. А если дублировать, то еще больше. Но это явно дешевле, чем амазон за 120к в год.

cdshines ★★★★★
(27.07.13 01:27:02 MSK)

Ссылка

Имхо дешевле купить.

Вон выяснилось, что нужно всего 35-40 дисков. Даже их обвязка будет не космических денег стоить.

~~dk-~~ ☆
(27.07.13 01:30:53 MSK)

Ответ на: комментарий от dk- 27.07.13 01:30:53 MSK

А по хранению со сжатием кто-нибудь что-нибудь может посоветовать?

Deleted
(27.07.13 01:34:10 MSK)
Последнее исправление: Deleted 27.07.13 01:34:50 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 27.07.13 01:34:10 MSK

я нет

но мне очень любопытно что и зачем генерит такие объемы?) ну не конкретно что, а сама суть.

~~dk-~~ ☆
(27.07.13 01:35:57 MSK)

Ответ на: комментарий от dk- 27.07.13 01:35:57 MSK

Предрасчет отдельных ветвей дерева игры.

Deleted
(27.07.13 01:43:31 MSK)
Последнее исправление: Deleted 27.07.13 01:43:58 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 27.07.13 01:43:31 MSK

Предрасчет отдельных ветвей дерева игры.

Тут реально надо обдумывать что-то с сжатием данных. Ибо 100 ТБ это нехилый размер. И скорее всего он нехило сжимается, если не секрет выложи примерно в каком виде будут значения, тогда возможно подскажут как лучше это сжать.

V1KT0P ★★
(27.07.13 02:06:09 MSK)

Ответ на: комментарий от V1KT0P 27.07.13 02:06:09 MSK

Ключ - строка ходов вроде «A/B/C/...», в среднем 50-100 байт, значение - матрица чисел с плавающей запятой, около 10 килобайт (для простоты можно закодировать одной строкой). Требуемый доступ - просто по заданному ключу. Т.е. сжимать надо в первую очередь значения, причем лучше не по отдельности, а все вместе. Вопрос в том, как это сделать, чтобы была возможность достаточно быстрых чтения/записи.

Deleted
(27.07.13 02:17:44 MSK)

Ответ на: комментарий от Deleted 27.07.13 02:17:44 MSK

Я думаю надо сделать примерно такое:
Отсортированные ключи разбить по большим файлам в которых одинаково начало до определенного хода. Это позволит сократить размер данных(не хранить начало ключей).
В этих файлах ключи должны быть выровнены до определенной длины и не быть сжатыми, да это увеличит размер(они всего-то 1% от данных занимают и мы ведь сократили на начале имени ключа) но зато позводит вести двоичный поиск по жесткому диску.
Дальше надо определить как эффективнее сжимать значения:
Если особой выгоды от попыток найти похожие значения для более лучшего сжатия нет, то просто для каждого файла ключей брать значения и паковать в архив где каждое значение это файл с номером. Где номер это номер строки ключа.
Если-же есть выгода от сжатия значений для ключей которые находятся в разных файлах, тогда в файлах ключей в конец просто дописывать в бинарном виде номер архива значений и номер значения в этом архиве(максимум 10 байт дополнительных для каждого ключа)
Осталось только алгоритм сжатия выбрать, например если критична скорость и объем занятой памяти, то не использовать непрерывное сжатие. Пусть сжатие будет чуть хуже, но зато доставать будет быстрее. Тут еще надо посмотреть нужна ли такая точность чисел и возможно попробовать чуть подкорректировать все значения так чтоб было больше похожих значений и больше степень сжатия.

V1KT0P ★★
(27.07.13 03:11:07 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.07.13 02:17:44 MSK

числа изначально строки? или они в машинном представлении?

AndreyKl ★★★★★
(27.07.13 09:03:40 MSK)

Ответ на: комментарий от Deleted 27.07.13 00:58:37 MSK

и буду через апи создавать/читать миллиард файлов по 10 килобайт (пишут же, что объем без ограничений)? Или что-то этому все же помешает?

помешает. Скорость. Ты их миллиард лет будешь читать. Да, «без ограничений»

~~drBatty~~ ★★
(27.07.13 09:07:08 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.07.13 02:17:44 MSK

Riak с бэкендом LevelDb - будет тебе сжатие.

vsn
(27.07.13 10:12:19 MSK)

Ссылка

Ответ на: комментарий от AndreyKl 27.07.13 09:03:40 MSK

Изначально - двумерный массив в Java. А как читать/писать его в базу, значения не имеет.

Deleted
(27.07.13 11:51:36 MSK)

Можно попробовать HBase. Там вам и сжатие (LZO, Gzip, Bzip2, Snappy), и MapReduce для предрасчетов (через hadoop streaming можно логику хоть на brainfuck писать), и масштабирование с отказоустойчивостью. У меня 3Тб база крутится и кушать не просит.

Ну или Cassandra, ее чуть попроще настраивать, на мой взгляд.

shutty ★
(27.07.13 12:02:19 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.07.13 11:51:36 MSK

Кстати, есть еще вот такая штука: http://www.mapdb.org/, Off-heap хранилище с интерфейсом как у HashMap. Ежели не хочется долбаться со всякими распределенными системами.

shutty ★
(27.07.13 12:05:19 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.07.13 02:17:44 MSK

http://en.wikipedia.org/wiki/Trie

nerdogeek ★
(27.07.13 12:17:12 MSK)

Ссылка

Ответ на: комментарий от Deleted 27.07.13 01:34:10 MSK

возможно спасет встроенное сжатие во всяких hbase и кассандрах. Ты с софтом определился уже?

Reset ★★★★★
(27.07.13 12:56:42 MSK)

Ответ на: комментарий от Deleted 27.07.13 02:17:44 MSK

Кстати, известно, сильно большая разница будет между A/B и A/B/C? А то, может, лучше будет хранить деревом с разницей?

keyran ★★
(27.07.13 14:06:04 MSK)

Ответ на: комментарий от Reset 27.07.13 12:56:42 MSK

Читаю про подобные cassandra базы данных со сжатием. Скорее всего, что-то подобное и выберу.

Deleted
(27.07.13 15:38:04 MSK)

Ссылка

Ответ на: комментарий от keyran 27.07.13 14:06:04 MSK

Там всё не очень понятно, удобнее все хранить в виде key-value и сжимать.

Deleted
(27.07.13 15:38:46 MSK)

Ссылка

Ответ на: комментарий от Dantix 27.07.13 01:02:01 MSK

redis

Redis is in-memory data store

in-memory

Предлагаешь затариться 100тб оперативки?

true_admin ★★★★★
(27.07.13 19:18:29 MSK)

Ответ на: комментарий от true_admin 27.07.13 19:18:29 MSK

Тред не читай @ сразу отвечай

Dantix ★★
(27.07.13 20:03:08 MSK)

Ссылка

Hadoop? HBase?

Если попроще, то да, как уже сказали - Riak. Cassandra норм, но искаропки нет MapReduce

~~vertexua~~ ★★★★★
(27.07.13 20:04:40 MSK)
Последнее исправление: vertexua 27.07.13 20:06:30 MSK (всего исправлений: 3)

Ссылка

Нужно провести некоторые вычисления
50-100 терабайт

Предвижу очень долгие вычисления и очень долгий процесс передачи по сети такого объема данных. Да, целых 100 терабайт - это очень ценная информация наверно

nerdogeek ★
(27.07.13 22:56:52 MSK)

Ответ на: комментарий от nerdogeek 27.07.13 22:56:52 MSK

мнения админов локалхоста тут только и не хватало.

а почему тред в Talks, кстати?

~~xtraeft~~ ★★☆☆
(27.07.13 23:04:41 MSK)

Ответ на: комментарий от Deleted 27.07.13 11:51:36 MSK

вопрос - двумерный массив чисел или строк. просто 10кбайт чего ты имеешь. если строк так они сожмуться так что от 10 кбай хорошо если 1кбайт останется. а если чисел, то фиг его. но раз в ява, предполагаю что float или double. кстати, если double а точность такая не нужна, то сэкономишь примерно вдвое просто перейдя на флоат.

AndreyKl ★★★★★
(27.07.13 23:09:52 MSK)

Ответ на: комментарий от xtraeft 27.07.13 23:04:41 MSK

мнения админов локалхоста тут только и не хватало

Погодь, ты хочешь сказать что сто терабайт данных быстро передаются по сети? Я к тому сказал, что может быть если есть возможность не сохранять такие данные, а вычислять при необходимости, то лучше вычислять.

nerdogeek ★
(28.07.13 11:05:20 MSK)

Ответ на: комментарий от nerdogeek 28.07.13 11:05:20 MSK

Я к тому сказал, что может быть если есть возможность не сохранять такие данные, а вычислять при необходимости, то лучше вычислять.

у человека конкретная задача - сохранить данные в базу.
ты предлагаешь ему этого не делать.

~~xtraeft~~ ★★☆☆
(28.07.13 15:29:19 MSK)

Ссылка

Ответ на: комментарий от AndreyKl 27.07.13 23:09:52 MSK

10 килобайт чисел (по 8 байт на одно число), точности флоата не хватает.

Deleted
(28.07.13 19:20:42 MSK)

Ссылка

Ответ на: комментарий от xtraeft 27.07.13 23:04:41 MSK

а почему тред в Talks, кстати?

В Talks людей больше.

Deleted
(28.07.13 19:21:05 MSK)

Ссылка

Такой вопрос по поводу хранения при помощи своего велосипеда: если хранить сами записи (без ключей) в одном большом файле, лежащем на Reiser4 с gzip-сжатием, и обращаться к ним через memory mapping, то это будет тормозить?

Deleted
(28.07.13 19:32:31 MSK)
Последнее исправление: Deleted 28.07.13 19:33:10 MSK (всего исправлений: 1)

Ответ на: комментарий от Deleted 28.07.13 19:32:31 MSK

Такой вопрос по поводу хранения при помощи своего велосипеда: если хранить сами записи (без ключей) в одном большом файле, лежащем на Reiser4 с gzip-сжатием, и обращаться к ним через memory mapping, то это будет тормозить?

Лучше всего взять и потестировать, ведь фейковые ключи нагенерить это не проблема.

V1KT0P ★★
(28.07.13 21:31:02 MSK)