А я в бинарном самопальном формате храню. Если заранее позаботиться о выравнивании, проблемы возникнут лишь при переходе на тупоконечную архитектуру. А это весьма маловероятно.
В БД хранить если: 1. Нет возможность делать ротацию, например, если нужен поиск по всем данным, допустим за N месяцев или лет. 2. Данных очень много (гигабайты) и нужен случайный доступ к участкам (опять-таки, поиск по всему объему). 3. Очень большой поток данных X записей в секунду, где Х - тысячи (цифра от балды, но принцип, думаю, понятен). Или такой же запрос на выборку. 4. Возможно что-то еще, например, когда много запросов от многих источников, чтобы доступ разруливать, но тут пусть спецы по БД подскажут.
Для начала я бы советовал определиться средой анализа. Я бы выбирал между R и ROOT (если параметров больше одного естественно, если один, то подойдёт любая рисовалка). А там определился бы с форматом.
Это в фитсах хорошо — там данных немного, можно спокойно в шапке хранить. И то есть проблема: само изображение-то хранится в бинарном виде, поэтому надо проверять «конечность» архитектуры.
Меньше: в БД ведь хэш идет не на каждое значение, а на запись. Конечно, если хранить по 1-2 32-битных целых числа на запись, в текстовом виде может быть будет компактней.
А не загнётся ли наоборот бд от такого? Ещё кстати есть изощрённый вариант: писать в бд напрямую, прямо в бинарные файлы хранилища. У MyISAM например структура очень простая (но у скулайта например наоборот, очень сложная, я так и не осилил).
Компактность никогда не была целью БД. Можешь поизучать ту же документацию к PostgreSQL на предмет рекомендуемого объёма для базы. Тебя ждут неожиданные открытия :)
Просто БД можно поставить отдельно на хорошую машину с большим диском.
Сомневаюсь.
А я нет, так как тестировал в реальности и так и сяк. Чтение файла много быстрее, чем доступ к БД (так как она читает тот же файл, а потом его по сети пересылает в общем случае в ASCII виде). Польза от БД, когда тебе данные нужно сохранять из любого места (я вон libpq на VAX/VMS перетаскивал для этого) и когда данных много. Правда когда данных _очень_ много приходится приглядываться к SciDB, но это совсем другая печенюшка.