LINUX.ORG.RU

Нужен совет по железу(контроллеру) для RAID5.

 


1

3

Ситуация - есть 6 hdd по 18тб и два по 12 - живут на вин10, заполнены практически полностью, свободно по 1тб. Есть желание сделать Raid 5, пока ещё не до конца определился на GNU/Linux или на TrueNAS. Есть понимание что надо докупить ещё 3 диска по 18тб - на их основе создать RAID5 и потихоньку диск за диском туда перевозить данные и подключать освободившиеся в raid с расширением пула. Те 8 hdd живущие сейчас на Винде - в мать по количеству sata разъемов не умещались, пришлось докупить какой-то нонейм контроллер расширения sata на дополнительные 16 сата разъемов, что бы винда видела все диски. Вот такой: https://sl.aliexpress.ru/p?key=uXg2rmu

Всё ок видит, правда если вместо выключения пк отправить в сон систему - то 50/50 диски на этом нонеймм контроллере не проснуться - помогает только перезагрузка системы. Мелочи. Вооот

Вопрос - подойдёт ли такой sata контроллер для моих желаний в RAID5 или лучше использовать что то надёжное и что именно. Я бы вообще не заморачивался с контроллером так как , насколько я могу судить можно RAID и без контроллера нынче собрать, только програмно? Но если много дисков, я так понимаю такой приблуды в домашних условиях, без профессионального серверного железа, не избежать. И вообще можете подсказать какие комплектующие используется при создании пула Raid5 состоящего из большого количества дисков? Возможно если хватит здоровья и жизни потихоньку увеличу количество дисков в пуле до максимального 16 штук. И не хотелось бы в дальнейшем, лет через 5-7, сидеть и думать как масштабироваться без потери данных. Уж лучше все на берегу решить

Если есть советы и рекомендации куда ткнутся с такими мыслями и где почитать - ткните носом пожалуйста.

Уже не по теме но - я домашний хомяк. Сервера видел только в ютубе ) До сих пор не понимаю каким железом в серверах поддерживается огромное количества дисков в стойках. Смотрел на сетевые материнки - ну нет же там такого количества разъемов на 30-40 hdd )) И каким образом там реализована безопасность хранения данных. Где про это почитать? ))

хочется странного - берется sas контроллер (лучше hba) и на нем собирается софтрэйд нужного уровня из нужного кол-ва дисков.

машину лучше с ЕСС памятью, чтобы потом не было сюрпризов.

брать каку с али - я бы не стал.

и да, если на рэйд5 один из дисков вывалился а на втором бэдблолк - привет потеря данных. потому лучше рэйд6 сразу делать.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Спасибо

«хочется странного» - не исключено

память - да, и она такая и есть

рейд6 - согласен (если уж я говорю о важности сохранения данных - то время на восстановление уже не в приоритете должно быть) Посмотрел на SAS контроллеры hba - максимально поддерживают до 8 устройств, возможно я не в той ценовой категории смотрел но выше 50 тыр не заглядывал. То есть в массиве не сможет быть более 8 дисков? Ну это я покопаю еще.

И остается открытым вопрос - каким надежным способом(если не рассматривать каку с али) подключить 10-16 HDD к материнской плате? Если есть мысли - рад услышать буду я

tatar221
() автор топика
Последнее исправление: tatar221 (всего исправлений: 2)

У современных дисков на многотерабайт объем сопоставим с их Unrecoverable Read Error Rate. Это значит что пятерка с очень большим шансом будет разваливаться до окончания синка, т.е. данные ты будешь терять быстро и много, одумайся пока не поздно.

slowpony ★★★★★
()
Ответ на: комментарий от tatar221

время на восстановление уже не в приоритете должно быть

Время на восстановление не в приоритете пока индикатор не начинает показывать ETA в несколько лет

slowpony ★★★★★
()

6 hdd по 18тб

Есть желание сделать Raid 5

Лучшее средство потерять все данные.

Всё ок видит, правда если вместо выключения пк отправить в сон систему - то 50/50 диски на этом нонеймм контроллере не проснуться - помогает только перезагрузка системы.

ИМХО сон и большой массив - не совсем совместимые вещи.

Купи 9300-16i + кабели на вторичке у нормального продавца и делай, например, raidz2

Dimez ★★★★★
()
Ответ на: комментарий от Dimez

A raidz2 это сильно отличается от raid6? Но да, я смотрел на z2 в TrueNAS - это можно и очевидно по мнению общества и даже нужно

Про сон - приму к сведенью, выключать все равно приходится пока.

«Купи 9300-16i» - такой market.yandex это нормально ?

tatar221
() автор топика
Ответ на: комментарий от tatar221
  • каким надежным способом(если не рассматривать каку с али) подключить 10-16 HDD к материнской плате?

Чисто моё мнение, что иногда проще поставить две железки, чем пытаться всё собрать на одной, надёжнее, удобнее и, в конечном итоге, дешевле.

vtVitus ★★★★★
()
Ответ на: комментарий от Dimez

И еще вопрос, вероятно классика жанра, но спрошу для собственного понимания - если контроллер умирает - то нужен такой же? Если да то выходит покупать надо два сразу - один в запас

tatar221
() автор топика
Ответ на: комментарий от tatar221

Если RAID-контроллер умирает, надо либо точно такой же, либо близкий (метаданные хранятся на дисках, совместимость есть)

Если умирает HBA (9300-16i/9400-16i), покупаешь любой HBA на замену, HBA не собирает массив.

Dimez ★★★★★
()
Ответ на: комментарий от tatar221

в запас - это всегда надо для минимизации простоя.

если собираешь рейд в режиме hba средствами ОС, то зависимость от марки контроллера снижается - ведь он не выполняет никаких действий, кроме подключения дисков.

aol ★★★★★
()
Ответ на: комментарий от tatar221

Есть LSI HBA и на 16 внутренних портов https://www.avito.ru/moskva/tovary_dlya_kompyutera/kontroller_lsi_sas_9201-16i_6gbps_hba_na_16_hdd_1798552921

Наверное у продавца есть и четырехголовые кабели.

Только надо иметь в виду, что разъём у контроллера pcie x8. Его надо вставлять либо в x8, либо в x16 слот на материнке. Ну либо нужен open ended слот.

iliyap ★★★★★
()
Последнее исправление: iliyap (всего исправлений: 1)
Ответ на: комментарий от iliyap

Только надо иметь в виду, что разъём у контроллера pcie x8. Его надо вставлять либо в x8, либо в x16 слот на материнке. Ну либо нужен open ended слот.

берется любой слот. отпиливается ему жопа. и все работает…

ну или в слоте контроллера прорезается пропил, если он с помойки за копейки и его менее жалко чем мамку.

NiTr0 ★★★★★
()

В мире серверов и СХД никто не делает RAID-5 на SATA-дисках такого объема. При ребилде возрастает нагрузка на остальные диски, и может выйти из строя второй диск.
RAID-5 для SATA закончился на дисках 1TB.

bigbit ★★★★★
()
Последнее исправление: bigbit (всего исправлений: 2)

каким железом в серверах поддерживается огромное количества дисков в стойках.

Погуглите про дисковые полки и СХД — это отдельные железяки, прикручиваемые в стойку. Некоторые на расстоянии похоже на сервера, но другие внутри. Плюс, для SAS существует понятие expander == разветвитель портов. Там (у SAS) это всё штатно, на уровне протокола,

mky ★★★★★
()

Тред не читал.

Софтовый рейд не может считаться рейдом.

Дешево и сердито - купить адаптек какой на пси-х. Желательно с кешем с батарейкой.

Все прочее это профанация

guyvernk
()

При таком способе переноса, как ты описал, построение raid5 из 3-х дисков, перенос части данных, высвобождение диска, добавление в новый массив и расширение велик шанс, что ты потеряешь все данные.

Т.к. при уменьшении или увеличении массива raid5 идёт его перестройка, пересчет и перераспределение блоков контрольных сумм.

Т.е. перестройка у тебя пройдет x2 раза, при извлечении диска из старого массива и при добавлении в новый массив.

При перестройке по сути перезаписывается заново по всем дискам весь объем массива.

Если не хочешь потерять данные - лучше купи сразу нужное количество новых дисков, видимо равное количеству и размеру дисков в большем из имеющихся массивов.

Собери его сразу, скопируй данные, освободи диски большего размера из старого массива, собери его и скопируй остаток данных, ты получишь два новых raid5 массива большего размера.

Перераспредели данные.

kostik87 ★★★★★
()
Последнее исправление: kostik87 (всего исправлений: 1)

Если хардварный контролёр рейда навороченный и сгорит, то придется долго и дорого искать такой-же. По этому лучше рейд софтварный собирать и покупать CPU помощнее.

Для безопасности: dm-crypt, raid, LVM, FS. Именно в таком порядке.

У меня аппаратные рейды дохли. Приходилось данные восстанавливать с бекапа. Рейд показывал что сдох один диск, начинал перестраивался во время сильной загрузки посреди рабочего дня и дох другой диск… Причины не знаю, может от старости, 3-5 лет поработают без ошибок, а потом эффект домино. Сегодня забочусь о качестве электричества. Софтварные рейды не дохли ни разу.

Сегодня делаю или софтварный raid2 или drbd. Надёжность восстановления железобетонна под любой нагрузкой.

anonymous
()
Ответ на: комментарий от slowpony

они теряются, просто ты об этом не знаешь

ну да, волшебные диски которые после записи нельзя считать целиком)))

и что плоский диск в отличие от массива с чередованием не выходит из строя до ресинка на каждой ошибке io

рэйд (софтрэйд как минимум) тоже при ошибке i/o не выходит из строя и не делает полный ресинк. при невозможности прочитать блок - рэйд просто восстанавливает блок благодаря избыточности, и записывает его взад на проблемный диск.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

Значит прочитает блок с несколькими инвертированными битами, которые не может определить коррекция ошибок. Еще аппаратная логика диска может глюкнуть при прочтении, проверке и пересылке такого количества данных. Это тоже в ходит в этот «показатель надежности».

anonymous
()
Ответ на: комментарий от NiTr0

Прочитает десятки битфлипов и не заметит. Там итак уже все работает на грани возможностей коррекции ошибок, любой блок читается с ошибками, просто хватает избыточности для коррекции. Если не хватает для коррекции, то хватает для детекции - для повторного чтения. При стечении обстоятельств, прочитается блок с серией ошибочных бит и детекция не сработает.

Это только про чтение. Запись тоже происходит с ошибками. Всё это друг на друга накладывается.

Про битфлипы в логике/контролере промолчу.

anonymous
()
Ответ на: комментарий от anonymous

кодами коррекции детектируется в разы больше ошибок, чем корректируется. так что мимо.

ну и да, вы же свои глубокомысленные выводы хотя бы подтверждали на практике прогоном badblocks -w на подобном диске? или это - голые размышления, основанные на непонимании того как считаются параметры из даташита диска?)))

NiTr0 ★★★★★
()
Ответ на: комментарий от mky

Опечатался имел ввиду raid1 - простое зеркало двух дисков. При простом зеркале в случае выхода из строя одного диска нет возрастания нагрузки на оставшийся в рейде диск. Тоже самое с drbd при выходе из строя одного узла нет никакой нагрузки на перестройку кластера (в случае если не было режима балансировки нагрузки), простое зеркало.

Мне кажется, что возможно есть проблема с заменой уставших, старых дисков в raid массивах под нагрузкой. Если кластер, то для замены диска в рейде можно вывести ноду, а так можно ждать вечера и снижения нагрузки..

anonymous
()
Ответ на: комментарий от anonymous

ну так и знал - это было обычное газирование луж, основанное на полном непонимании методологии и не подтвержденное практикой)))

скорость записи у дисков давно под 200 МБ/с. и при 200 МБ/с 18 ТБ запишется всего за 25 часов, + столько же на чтение.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

не подтвержденное практикой

Моя практика в том, что райд5 на много дисков (5+) умирает при замене (сбойного) диска.

скорость записи у дисков давно под 200 МБ/с

Читать записанное кто будет? Практик, показывай давай скорость badblock -w на многоТБ диске, который скорее всего еще окажется SMR (где наложение дорожек, из-за чего по опредлению будет читаться с искажениями, хорошо если избыточности хватит для коррекции)

anonymous
()
Ответ на: комментарий от anonymous

Моя практика в том, что райд5 на много дисков (5+) умирает при замене (сбойного) диска.

а вы периодический ресинк небось не делаете?))) и сбойный диск находите только тогда, когда он уже полностью разваливается?)))

Читать записанное кто будет?

badblocks же. badblocks -w - пишет паттерн, а потом его читает. 4 цикла с разными паттернами. внезапно, не правда ли?

Практик, показывай давай скорость badblock -w на многоТБ диске

1-2ТБ уже показывали 180 МБ/с чтение/запись. у более свежих скорости еще выше.

SMR (где наложение дорожек, из-за чего по опредлению будет читаться с искажениями, хорошо если избыточности хватит для коррекции)

бред же, отборный. или вы не в курсе что ширина магнитного поля пишущей головы больше чем ширина зазора считывающей головы, потому и SMR внедрили?)))

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

1-2ТБ уже показывали 180 МБ/с чтение/запись.

Мне не нужно абстрактные чтение/запись.

Мне нужна скорость работы badblocks -w, особенно на smr дисках. Особенно честная запись блока на диск, и честное чтениие с диска, а не с огромного кеша. Иначе это не про тестирование диска, а тестирование кеша диска.

ширина магнитного поля пишущей головы больше чем ширина зазора считывающей головы

Перекрытие есть. Читает край записанной дорожки и не с центра дорожки, где более надежная запись.

anonymous
()
Ответ на: комментарий от anonymous

Мне нужна скорость работы badblocks -w, особенно на smr дисках. Особенно честная запись блока на диск, и честное чтениие с диска, а не с огромного кеша. Иначе это не про тестирование диска, а тестирование кеша диска.

ок, купите мне SMR диск, проведу вам тесты. за свои деньги покупать мусор смысла не вижу.

Перекрытие есть. Читает край записанной дорожки и не с центра дорожки, где более надежная запись.

и что, что перекрытие?

повторяю еще раз: ширина дорожки, записанной пишущей головкой, больше, чем ширина зазора считывающей головы. и потому пофиг где там считывающая голова читает - по центру, или сбоку.

NiTr0 ★★★★★
()
Ответ на: комментарий от NiTr0

ок, купите мне SMR диск, проведу вам тесты.

Не важно. Я свои нетеррабайтные дисках проверял, скорость около 50-100Мб/с по iotop. Прервал через 2 часа, так как судя по прогрессу, надо ждать пару-тройку суток.

anonymous
()