Как лучше хранить статистику?

0

1

В базе данных или же текстом?

Всякие параметры типа температуры итд

Ссылка

←	Linux from Scratch - с чем его едят? Альтернативы, Более полезные варианты?

update-initramfs is disabled since running on read-only media

→

Т.е. какие преимущества может дать БД?

cvs-255 ★★★★★
(15.01.13 19:15:52 MSK) автор топика

Ответ на: комментарий от cvs-255 15.01.13 19:15:52 MSK

А смотря сколько ее у тебя и что ты хочешь с ней делать.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.13 19:16:25 MSK)

Ответ на: комментарий от Eddy_Em 15.01.13 19:16:25 MSK

Хранить, и при необходимости смотреть всякие распределения. Получать планирую по крону раз в несколько часов.

cvs-255 ★★★★★
(15.01.13 19:17:07 MSK) автор топика
Последнее исправление: cvs-255 15.01.13 19:17:32 MSK (всего исправлений: 1)

За постановку вопроса - неуд.

Какую статистику? Какие параметры? Температуру чего? Речь идёт о данных с метеостанции, или из ветеринарной клиники?

~~yvv~~ ★★☆
(15.01.13 19:19:13 MSK)

Ссылка

Ответ на: комментарий от cvs-255 15.01.13 19:17:07 MSK

Если сортировать не надо, то и БД не нужна.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.13 19:26:49 MSK)

Ответ на: комментарий от Eddy_Em 15.01.13 19:26:49 MSK

Ок.

cvs-255 ★★★★★
(15.01.13 19:29:45 MSK) автор топика

Ссылка

Ответ на: комментарий от Eddy_Em 15.01.13 19:26:49 MSK

Тогда сразу появляется вопрос о формате хранения.

Для минимизации будущих проблем я бы выбрал sqlite.

note173 ★★★★★
(15.01.13 19:33:39 MSK)

Бинарщина ещё как вариант. Смотря сколько данных и как часто ими нужно ворочать.

Kalashnikov ★★★
(15.01.13 19:51:58 MSK)

Ссылка

Ответ на: комментарий от note173 15.01.13 19:33:39 MSK

А я в бинарном самопальном формате храню. Если заранее позаботиться о выравнивании, проблемы возникнут лишь при переходе на тупоконечную архитектуру. А это весьма маловероятно.

~~Eddy_Em~~ ☆☆☆☆☆
(15.01.13 20:02:18 MSK)

Ссылка

В БД хранить если:
1. Нет возможность делать ротацию, например, если нужен поиск по всем данным, допустим за N месяцев или лет.
2. Данных очень много (гигабайты) и нужен случайный доступ к участкам (опять-таки, поиск по всему объему).
3. Очень большой поток данных X записей в секунду, где Х - тысячи (цифра от балды, но принцип, думаю, понятен). Или такой же запрос на выборку.
4. Возможно что-то еще, например, когда много запросов от многих источников, чтобы доступ разруливать, но тут пусть спецы по БД подскажут.

В остальных случаях ИМХО не нужно.

Kroz ★★★★★
(16.01.13 02:07:21 MSK)

Ответ на: комментарий от cvs-255 15.01.13 19:15:52 MSK

БД имеет смысл заводить, если тебе нужен унифицированный доступ откуда угодно. Это _очень_ важно.

Есть безусловно ещё зависимость от объёма сохраняемых данных.

Evgueni ★★★★★
(16.01.13 07:24:57 MSK)

Ответ на: комментарий от cvs-255 15.01.13 19:17:07 MSK

Для начала я бы советовал определиться средой анализа. Я бы выбирал между R и ROOT (если параметров больше одного естественно, если один, то подойдёт любая рисовалка). А там определился бы с форматом.

Evgueni ★★★★★
(16.01.13 07:28:09 MSK)

Ссылка

Ответ на: комментарий от Evgueni 16.01.13 07:24:57 MSK

Я бы еще добавил, что БД имеет смысл, если не хочется заморачиваться с остро/тупоконечностью и разрядностью целевой архитектуры.

~~Eddy_Em~~ ☆☆☆☆☆
(16.01.13 09:28:53 MSK)

Ответ на: комментарий от Eddy_Em 16.01.13 09:28:53 MSK

А, это просто: хранить данные в текстовом виде.

Evgueni ★★★★★
(16.01.13 09:32:16 MSK)

Ответ на: комментарий от Evgueni 16.01.13 09:32:16 MSK

1) до фига места занимает
2) долго считывать

Это в фитсах хорошо — там данных немного, можно спокойно в шапке хранить. И то есть проблема: само изображение-то хранится в бинарном виде, поэтому надо проверять «конечность» архитектуры.

~~Eddy_Em~~ ☆☆☆☆☆
(16.01.13 09:33:08 MSK)
Последнее исправление: Eddy_Em 16.01.13 09:34:02 MSK (всего исправлений: 1)

Ответ на: комментарий от Eddy_Em 16.01.13 09:33:08 MSK

1) до фига места занимает

В БД оно занимает тоже дофига места, так что вполне сравнимо, да и при желании текстовый лог можно заархивировать.

2) долго считывать

Медленнее чем из бинарного файла (опять же можно архивацию прямо в программу чтения/записи встроить), но много быстрее чем из БД.

И то есть проблема: само изображение-то хранится в бинарном виде, поэтому надо проверять «конечность» архитектуры.

А что мешает изображение хранить не в бинарном виде? eps же.

Evgueni ★★★★★
(16.01.13 09:56:34 MSK)
Последнее исправление: Evgueni 16.01.13 09:57:24 MSK (всего исправлений: 1)

Ответ на: комментарий от Evgueni 16.01.13 09:56:34 MSK

В БД оно занимает тоже дофига места

Меньше: в БД ведь хэш идет не на каждое значение, а на запись. Конечно, если хранить по 1-2 32-битных целых числа на запись, в текстовом виде может быть будет компактней.

при желании текстовый лог можно заархивировать

А работать с ним потом как?

много быстрее чем из БД

Сомневаюсь.

~~Eddy_Em~~ ☆☆☆☆☆
(16.01.13 10:00:26 MSK)

Ответ на: комментарий от Kroz 16.01.13 02:07:21 MSK

Очень большой поток данных X записей в секунду

А не загнётся ли наоборот бд от такого? Ещё кстати есть изощрённый вариант: писать в бд напрямую, прямо в бинарные файлы хранилища. У MyISAM например структура очень простая (но у скулайта например наоборот, очень сложная, я так и не осилил).

Kalashnikov ★★★
(16.01.13 10:08:15 MSK)

Ответ на: комментарий от Eddy_Em 16.01.13 10:00:26 MSK

Меньше

Компактность никогда не была целью БД. Можешь поизучать ту же документацию к PostgreSQL на предмет рекомендуемого объёма для базы. Тебя ждут неожиданные открытия :)

Просто БД можно поставить отдельно на хорошую машину с большим диском.

Сомневаюсь.

А я нет, так как тестировал в реальности и так и сяк. Чтение файла много быстрее, чем доступ к БД (так как она читает тот же файл, а потом его по сети пересылает в общем случае в ASCII виде). Польза от БД, когда тебе данные нужно сохранять из любого места (я вон libpq на VAX/VMS перетаскивал для этого) и когда данных много. Правда когда данных _очень_ много приходится приглядываться к SciDB, но это совсем другая печенюшка.

Evgueni ★★★★★
(16.01.13 11:25:48 MSK)