LINUX.ORG.RU
ФорумAdmin

Рассудите за RAID 0 на SSD

 , ,


0

1

Ахой! За последнее время было слишком много выпито и скурено и в голове возник вопрос - если дан mdadm массив RAID 0 из двух новых SSD, то ведь по логике работы нулевого массива данные будут записываться поочередно на каждый из дисков, а это значит что и изнашиваться они будут +/- одинаково. Отсюда следует что вероятность отказа, по выработке ресурса ячеек, будет считай суммироваться со всех дисков в этом массиве. Конечно тут надо брать в учёт контроллер/память на котором работают эти диски, TRIM и фазу луны, но надёжность такого массива будет всяко выше надёжности одного диска? Поясните пожалуйста, а то покоя мне нет!


1. Надёжность диска определяется не только износом ячеек, но и надёжностью контроллера

2. x2 контроллеров снижают надёжность в два раза

3. Лично мне за всё время пользования SSD не встречались «протёртые до дырки» диски, они чот в основном из за контроллера дохли, или менялись на более ёмкие\быстрые не успевая протереться до дыр.

Jameson ★★★★★
()
Последнее исправление: Jameson (всего исправлений: 1)

Надежность такого массива будет равна надежности самого ненадежного из дисков в этом массиве (потому что твой массив выйдет из строя одновременно с выходом из строя этого, одного из двух, диска, duh)

slowpony ★★★★★
()

RAID 0 это бесполезная, тормозящая и ненадёжная ерунда, лучше смонтируй диски в отдельные директории и раскидывай по ним данные вручную/симлинками/приложением.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)

но надёжность такого массива будет всяко выше надёжности одного диска?

Нет. При условии, что на этом одном диске ячеек столько же, сколько в массиве суммарно. То есть, массив из двух терабайтников не будет надёжнее одного двухтерабайтника, равно как и наоборот. Будет одинаково. Если писать часть файлов на один, а часть на другой, то тоже никакой разницы с массивом (кроме того, что в случае массива потеряются все данные при выходе из строя одного диска, а в случае двух отдельных — только те данные, что были на сдохшем). Короче, не занимайся ерундой. RAID0 поможет, если скорости SSD почему-то не хватает, больше он ни для чего не нужен.

CrX ★★★★★
()
Ответ на: комментарий от router

Лол, а зачем сообщение выше дизлайкнул? Оно верно ничуть не менее следующего (если мы не считаем, что «надёжность» это «вероятность отказа»), которое лайкнул…

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Будет одинаково.

Не будет, о чём господин @firkax и (абсолютно правильно) упомянул. Будет почти в 2 раза хуже (при одинаковых и небольших вероятностях отказа накопителей).

bugfixer ★★★★★
()
Ответ на: комментарий от bugfixer

Не будет

Если мы говорим об износе ячеек, а не о вероятностях, о чём и говорил ТС, то будет.

Будет почти в 2 раза хуже (при одинаковых и небольших вероятностях отказа накопителей).

Да. Если мы говорим о вероятностях отказа (что чаще как раз случается из-за контроллера, а не износа), то это верно. Я же изначально говорил о скорости износа ячеек (о чём и спрашивал ТС), а не вероятности отказа.

P.S. И да, я полностью согласен, что вероятность отказа важнее, и ТС занимается ерундой. О последнем я в том посте тоже написал.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от CrX

Если мы говорим об износе ячеек, а не о вероятностях, о чём и говорил ТС, то будет.

ТС спрашивал про надёжность, а это как раз вероятность неожиданно сдохнуть. Износ ячеек это не надёжность а ресурс. Ресурс примерно удвоится, да.

А хотя

вероятность отказа, по выработке ресурса ячеек,

ТС видимо сам не знает что ему нужно.

firkax ★★★★★
()
Последнее исправление: firkax (всего исправлений: 1)
Ответ на: комментарий от CrX

Не будет

Если мы говорим об износе ячеек, а не о вероятностях, о чём и говорил ТС, то будет

Соглашусь с кучей оговорок: если не приближаться к capacity - то да. А так всё будет определяться тем сколько они там на’overprovision’или, и насколько хорошо compaction algo работает, причём на конкретных write patterns.

bugfixer ★★★★★
()
Ответ на: комментарий от firkax

ТС видимо сам не знает что ему нужно.

Да почему же не знает?) На рабочей машине стоят 2 диска в нулевом массиве. Под систему и под данные. Бэкапы делаю регулярно + облака, так что на отказы пофигу так то. А на счёт вероятности отказа просто захотелось «альтернативно» поразмышлять. :)

Hg194
() автор топика

Если считать, что контролер не может сломаться и диск дохнет только от износа, то надёжней. Но это слишком смелое допущение. На практике вместо такого массива лучше взять диск в 2 раза больше размером.

vbr ★★★★
()
Ответ на: комментарий от vbr

Если один диск на 2 ТБ и два диска по 1 ТБ, то суммарно в обоих случаев одинаковое количество секторов, и распределяться запись по ним будет тоже примерно одинаково, соответственно всё так же в плане износа.

CrX ★★★★★
()
Ответ на: комментарий от CrX

Кажется мы разное обсуждаем. Я говорю, что рейд-0 из двух дисков по 1 ТБ надёжней в плане износа ячеек, чем один диск на 1 ТБ. Если ты хочешь сравнить рейд-0 из двух дисков по 1 ТБ с одним диском на 2 ТБ, то я соглашусь, что второй вариант не хуже первого.

С другой стороны если сдохнет контролер у диска на 2 ТБ, то всё, каюк всем двум терабайтам. А у двух дисков по 1 ТБ оба контролера, наверное, сдохнут с куда меньшей вероятностью (хотя один из них сдохнет с большей). И заменить придётся только один диск из двух в таком случае. Поэтому, если сохранность данных не интересует, то может быть вариант из двух дисков будет экономически оправданней, самую малость.

vbr ★★★★
()
Ответ на: комментарий от vbr

Ну это очевидно, что «2 ТБ „ячеек“» износятся в 2 раза позже, чем «1 ТБ „ячеек“» при одинаковой интенсивности записи. Только RAID0 тут ни при чём, по сути он просто объединит 2 диска в один (в плане количества ячеек и их износа, соответственно).

А у двух дисков по 1 ТБ оба контролера, наверное, сдохнут с куда меньшей вероятностью (хотя один из них сдохнет с большей).

Вот именно, что один из них сдохнет с большей. И чтобы пришёл каюк двум терабайтам данных в случае с RAID0 достаточно, чтобы сдох один. Конечно, второй потом можно использовать для чего-то ещё…

И заменить придётся только один диск из двух в таком случае. Поэтому, если сохранность данных не интересует, то может быть вариант из двух дисков будет экономически оправданней, самую малость.

Нет. Потому что второй тоже, вполне вероятно, придётся заменить. С экономической точки зрения чуть оправданнее один большой диск, поскольку он будет потреблять чуть меньше электроэнергии. Ну и стоит один большой диск, как правило, дешевле, чем два маленьких (за исключением самого-самого топового объёма, который некоторое время после появления может стоить неоправданно дорого). Но самое главное тут всё же, что данные потеряются с бо́льшей вероятностью. А теоретически они могут быть дороже любых дисков.

Если есть два диска, лучше просто писать на них разные данные (более менее прикинув, чтобы объём записи был хотя бы сопоставим). Вот тогда да, если сдохнет один, то хотя бы те данные, что были на втором, сохранятся.

CrX ★★★★★
()
Последнее исправление: CrX (всего исправлений: 1)
Ответ на: комментарий от firkax

RAID 0 это бесполезная, тормозящая и ненадёжная ерунда

Ненадежная ровно настолько, насколько и одиночный диск. Какая разница вылетел внезапно у вас одинокий диск или диск в raid0 ? Один фиг из бэкапа восстанавливать. Обьемы только разные.

лучше смонтируй диски в отдельные директории и раскидывай по ним данные вручную/симлинками/приложением.

Не всегда удобно.

Не подумайте, что я за raid0, я его избегаю как огня, только ответил на ваши тезисы.

anc ★★★★★
()

А какой у вас высокий смысл в raid 0 ? У raid0 есть два преимущества перед одиночным диском:
1. Скорость записи (не актуально для ssd)
2. Обьем одного блочного устройства. Тут лучше 20 раз подумать, а оно точно надо?
ИМХО минусом raid0 является то, что в случае внезапного развала, его пересобрать не получится, в отличии от raid5/6.

anc ★★★★★
()
Ответ на: комментарий от Hg194

На рабочей машине стоят 2 диска в нулевом массиве. Под систему и под данные. Бэкапы делаю регулярно + облака, так что на отказы пофигу так то.
Под систему и под данные

Маньяк

Бэкапы делаю регулярно + облака
регулярно

Ну-ну

так что на отказы пофигу так то.

Все так говорят... до первого случая.

anc ★★★★★
()
Ответ на: комментарий от anc

А какой у вас высокий смысл в raid? У raid0 есть два преимущества перед одиночным диском

Согласен с обоими. Но

Скорость записи (не актуально для ssd)

неправда. Вы, видимо, с соотвествующими нагрузками просто не сталкивались.

bugfixer ★★★★★
()
Ответ на: комментарий от bugfixer

неправда. Вы, видимо, с соотвествующими нагрузками просто не сталкивались.

Я ответил в контексте вопроса ТС, у него явно не те нагрузки что бы всякие raidN строить.

anc ★★★★★
()

Бывают еще гибридные диски hdd+sdd, так что необязательно брать два устройства, чтобы получить неожиданные проблемы на ровном месте.

Irma ★★
()

Создаешь btrfs/zfs на нескольких дисках и забываешь про mdadm… Тебе, конечно, сейчас расскажут про то как диск может неожиданно скончаться, но они умирают не сразу и сначала переходят в режим read-only… Данные то можно с него спасти, но их как-то черезжопно нужно переносить, хотя можно посмотреть справку по btrfs ballance там скорее всего можно данные со старого диска (поврежденного) копировать на новый, а затем его удалить

uwuwuu
()
Ответ на: комментарий от uwuwuu

Тебе, конечно, сейчас расскажут про то как диск может неожиданно скончаться, но они умирают не сразу и сначала переходят в режим read-only…

Зависит от модели, дешмань именно умирает.

anc ★★★★★
()
Ответ на: комментарий от Jameson
  1. Надёжность диска определяется не только износом ячеек, но и надёжностью контроллера

Тут ТС упомянул про mdadm, так что хотя бы этого слабого звена не будет. Рейд програмный.

alex_sim ★★★★
()

Не понимаю я зачем тебе нулевой рейд?!?! нервишки пощекотать, нулевка для скорости и размера диска, но данные должны быть временные, типа поработал с чем то огромным и сохранил на чем то более надежном.

alex_sim ★★★★
()
Последнее исправление: alex_sim (всего исправлений: 1)
Ответ на: комментарий от alex_sim

но данные должны быть временные

Не обязательно именно временные, скорее те которые не страшно потерять или не страшно потерять в случае изменений между бэкапами. Но с бэкапами надо ориентироваться не на расписание бэкапов, а -n бэкапов назад, т.к. всё случается, по какой-то причине может поломаться система бэкапа и пока чинили &etc больше времени пройдет.

ЗЫ Пока писал, вспомнил случай пролюбливания 0-го на fake raid контроллере. rack mount сервак c 6-ю хардами из которых два были в raid0, понадобилось их вытащить, вытащили, но не подписали, а просто сложили стопочкой и как потом выяснилось не в той последовательности, когда назад воткнули, рэйд попрощался. Восстанавливали из бэкапа, благо на нулевом ничего предположительно нужного, помимо того что бэкапилось, не хранилось.
Предупреждая обвинения в халатности скажу, что уважительная причина у этого факапа была, точнее даже три причины.

anc ★★★★★
()
Ответ на: комментарий от uwuwuu

Создаешь btrfs/zfs на нескольких дисках и забываешь про mdadm…

Используешь mdadm и забываешь про кривую btrfs и прекрасную, но отсутствующую в ядре (и тем самым добавляющую немного геморроя при обновлениях оного) zfs, как страшный сон.

Тебе, конечно, сейчас расскажут про то как диск может неожиданно скончаться

И правильно сделают.

но они умирают не сразу и сначала переходят в режим read-only…

Так тоже могут. Но это надо сильно мучать диск (нагруженной SQL, например, или постоянным автоскачиванием-удалением торрентов). В обычных условиях таки скорее может случиться, что скончается неожиданно. Хотя это, конечно, зависит и от самого SSD, типа памяти, используемого контроллера и т.д.

CrX ★★★★★
()
Ответ на: комментарий от anc

Не обязательно именно временные, скорее те которые не страшно потерять или не страшно потерять в случае изменений между бэкапами.

Да, для вполне «постоянных», но совершенно не ценных данных, вполне норм. Я вот для (установленных) игр юзаю, без всякиех бэкапов. Сейвы, естественно, отдельно. Сдохнет и сдохнет: установить игру дело от 1 до 30 минут ожидания (в зависимости от объёма).

CrX ★★★★★
()
Ответ на: комментарий от CrX

Да, для вполне «постоянных», но совершенно не ценных данных, вполне норм.

Для относительно ценных, но не изменяемых постоянно, тоже годится, если есть бэкапы. Хотя я бы так не делал, если есть возможность так не делать :) Как писал выше «я его избегаю как огня».

anc ★★★★★
()