Эксперимент с btrfs: 24 диска и 2 гигабита записи на них

btrfs

1

3

Есть линукс, на нём 24 харда по 3 TB.

Собрал рейд 0 на btrfs и залил туда 98% данных.

Больше оно практически не работает. df -h уже много часов пытается отработать.

Вопрос: как-то это тюнится? Компрессия выключена.

Ссылка

←

ntp

Настройка vsftp и IP каьеры

→

← 1 2 →

1. Не знаю насчёт btrfs, но ext4 при заполнении до 100% страдает от фрагментации. она, конечно, не валится, но подтормаживает. По умолчанию 5% места зарезервировано для рута и такой проблемы с производительностью не возникает. Это на заметку.

2. ты либо пишешь данные последовательно на каждый диск (и остальные простаивают) либо пишешь на все сразу кусками и тогда при вылете любого диска ничего не восстановить, выше объяснили. Не надо все диски объединять в raid0. Только группами по столько, чтобы хватило пропускной способности.

3. Если нужна устойчивость типа «диск сломался, заменили, почти все данные целы» и простота, то озвученный выше вариант с aufs/unionfs/т.п. - самое разумное, имхо. А одна фс .растянутая через все драйвы - самое сомнительное решение. Да ещё с экзотической фс.

legolegs ★★★★★
(22.08.17 21:06:43 MSK)

Ответ на: комментарий от anonymous 22.08.17 21:05:35 MSK

А смысл делать страйп из страйпов :)

Скорее, страйп из raid6. Смысл - в надежности в 2 диска с менее стремным количеством дисков в группе. Но не суть.

ну сдохнет все и хрен с ним, новый сбилдим

1. И часто дохнет? 2. Если все так просто, может нафиг raid6? raid0 из 16 - вперед! :)

Вообще, я только хотел узнать, норм ли работает raid60 на 16 дисках? Но вижу, у вас специфические задачи, это не критичные данные

Deleted
(22.08.17 21:37:12 MSK)

Ответ на: комментарий от Deleted 22.08.17 21:37:12 MSK

raid6 это тоже страйп, с четностью.

у raid6 & raid60 одинаковая минимальная надёжность - потеря 3 дисков - пипец массиву. Насколько отличается вероятность отказа 3 из 16 против 3 из 8? Я уже не помню как это считается:)

Один раз сдох, и то из за отключения кондера в самый разгар лета, 2 винта умерли сразу, 2 в процессе ребилда. raid0 не пойдёт, отмазываться нечем будет если сдохнет.

Вообще 60 нормально работает, сначала он и был.

anonymous
(22.08.17 23:43:33 MSK)

Ответ на: комментарий от legolegs 22.08.17 21:06:43 MSK

я не очень понимаю, как aufs или unionfs могут помочь в автоматическом выборе девайса для следующего создаваемого файла.

max_lapshin ★★★★★
(22.08.17 23:51:26 MSK) автор топика

Ответ на: комментарий от Deleted 22.08.17 20:43:17 MSK

реально raid6 на 16 дисках? т.е. 14 + 2избыточных? Необычно для меня.

А чего нереального? Типовой конфиг. В симметриксе вон дают создать только 6+2 или 14+2, других конфигураций для девайсов R6 не предлагается.
Видел 14+2 на SATA, особых нареканий кроме высокой загрузки бэкэнд-директоров не было. Да и то только потому, что там зачем-то лежали данные, которые на SATA обычно не кладут.

bigbit ★★★★★
(23.08.17 00:19:22 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.08.17 23:43:33 MSK

Емц вообще советует райд5 в бестпрактис для своих масствов. Представляю разговор, что как же так, вылет 2 дисков и привет.

stave ★★★★★
(23.08.17 00:33:08 MSK)

Ссылка

Ответ на: комментарий от max_lapshin 22.08.17 23:51:26 MSK

Ну какой-то алгоритм там должен быть. Если не подойдёт, то можно заставить софт писать на разные /mnt/storage* всё лучше, чем дохрена дисков под одним томом btrfs или lvm+ext4

legolegs ★★★★★
(23.08.17 00:48:06 MSK)

Так вот как выглядят мужики с мифриловыми яйками

targitaj ★★★★★
(23.08.17 00:54:35 MSK)

Ссылка

Ответ на: комментарий от timdorohin 21.08.17 22:59:41 MSK

Если же это линейная запись, то и 3 диска пормально вытянут, это ведь всего 256МиБ/с

Во-первых, 2 Гбит/с - это 238.42 МиБ/с, а вовсе не 256. 2000000000÷8÷1024^2=238.4185791 Во-вторых, не 3, а 2 диска. Современные винты дают примерно 180 МиБ/с линейного чтения и столько же линейной записи.

anonymous
(23.08.17 01:15:50 MSK)

Ответ на: комментарий от legolegs 23.08.17 00:48:06 MSK

вот об этом и речь. Делать свою систему хранения или пока рано

max_lapshin ★★★★★
(23.08.17 08:26:04 MSK) автор топика

Ссылка

Разве btrfs не требует до 30% объема чисто для своих нужд?

Virtuos86 ★★★★★
(23.08.17 09:10:16 MSK)

Ссылка

Ответ на: комментарий от anonymous 23.08.17 01:15:50 MSK

Это в идеальных условиях и с краю блина.

legolegs ★★★★★
(23.08.17 09:26:05 MSK)

Ответ на: комментарий от legolegs 23.08.17 09:26:05 MSK

Линейный доступ и есть идеальные условия. А в центре блина будет тебе ~140 вместо ~180, так что для двух Гбит/с всё равно пары винтов достаточно.

anonymous
(23.08.17 10:03:01 MSK)

Ссылка

Ответ на: комментарий от anonymous 22.08.17 21:05:35 MSK

Ребилд идёт медленно

Какбэ в этом один из поинтов создания raid60, вместо большого raid6, помимо повышенной производительности.

anonymous
(23.08.17 13:07:47 MSK)

Ответ на: комментарий от anonymous 22.08.17 23:43:33 MSK

у raid6 & raid60 одинаковая минимальная надёжность

нет, не одинаковая. чем больше n в nD + 2P, тем больше вероятность факапа.

anonymous
(23.08.17 13:41:31 MSK)

Ответ на: комментарий от anonymous 23.08.17 13:07:47 MSK

Этот поинт не проходит проверку практикой — время ребилда raid10/raid5/raid50 на 16x72gb scsi 10k примерно одинаково, проверяли ещё лет 10 назад на hp ml370g5.

anonymous
(23.08.17 19:11:58 MSK)

Ответ на: комментарий от anonymous 23.08.17 19:11:58 MSK

Короче, хочешь хорошо - делай сам

max_lapshin ★★★★★
(23.08.17 19:43:54 MSK) автор топика

Ответ на: комментарий от anonymous 23.08.17 13:41:31 MSK

Ну я имел ввиду что в обоих случаях 3 винта минимум для похерить весь массив :).

чем больше n в nD + 2P, тем больше вероятность факапа.

Вот насколько больше? Как считается? Вот: 3 любых из 16 против (3 из этих 8 или 3 из тех 8), формулы можешь напомнить?

А по теме: как показала наша практика за 10++ лет — рейды под это дело не катят, надёжнее отдельные диски. На старых DM2 диски 8 лет отпахали в режиме круглосуточной записи, а на корзине за 3 года все 16 поменяли.

anonymous
(23.08.17 19:49:04 MSK)