История изменений
Исправление dk__, (текущая версия) :
Пришло время некропостинга! Некропостинг сам себя не апнет!
Писал я тут ранее:
У меня 6й на 8 дисках. Пока во всем приятнее ссд. Отказы и ребилды репетировал успешно. Но планирую пару лет посидеть без докупок, а потом расширяться зеркальными ссд.
Ну что сказать, беда не приходит одна. Хотя все и кончилось хорошо.
На момент прихода беды я отказался от HS диска и оставил просто R6 на 8 дисках (глупо, да). (Напомню, что его задача - относительно быстрое однопоточное однопользовательское хранилище архивов, не отменяющее бэкапов, но страхующее от аппаратного вылета диска. И цена сильно ниже ссд. И… эти диски у меня уже есть, им от 3 до 5 лет, и будут работать, пока не начнут помирать).
Ну так вот, пересобирал компы. Апгрейд и все такое. К рейду в гости приехал новый проц. Но я не вставил до конца один из кабелей питания дисков. И массив запустился без одного из дисков. Дальше он начал орать (буквально). Я заметил, выключил комп, вставил питание. Массив пошел на типа проверку. Но сделал ее подозрительно быстро (для 16тб то). Потом… этот диск опять отпал. Назад массив его уже не принял. А потом не запустился на авторебилд и на другой диск вставленный вместо проблемного.
Тут я начал очковать, и решил вычитать данные (благо было куда), а потом разбираться с массивом. Начал читать с него… и минут через 20 том пропал из системы. Тут я начал очковать сильно. Потом было попыток 20 запустить ребилд на принудительно созданный HS диск. Но ни в какую из веб гуя он это не делал. А еще полезли какие-то аппаратные проблемы с компом - он начал рандом перезагружаться. С ошибками IOMMU. Заочковал я еще сильнее.
Пошел в прошивку контроллера (до загрузки ОС), там запустил принудительный ребилд. Он прошел его, прошел проверку. И… тома в системе нет! Уже был морально готов вести диски и контроллер в контору по восстановлению, но решил попробовать их R.saver (софтина такая). И, о чудо! Все вычиталось легко и просто. Она быстро собрала виртуальный рейд и дала все прочесть. (R-studio - не смогла нихрена вообще) Из многих сотен тысяч файлов не прочлись всего несколько штук.
После разбора массива выяснилось, что тот диск, с проблемами по питанию - посыпался. Тут уже не узнать - он был такое еще до моих кривых рук, или я его добил. Но вот так.
МОРАЛЬ:
- Самое ценное было в бэкапах. И я молодец.
- Все еще не вижу замены 6му рейду у себя. Выбрасывать пачку рабочих (аптайм от 3 лет) вд редов я не готов. Даже докупил еще.
- Соберу R+HS. +1 диск в шкафу. И отдельно зеркало на 2 дисках (2х16 тб лол, но это медленнее и более рисково).
- Да, при первичной сборке массива я репетировал отказы и ребилды. И хрен оно сработало на реальной проблеме. Но двойная избыточность помогла - данные целы.
Продолжу наблюдения. Да у меня есть ссд, в сумме где-то 6тб. Но этого мало. А еще пару десятков тб - дорого.
ЗЫ Опция «раз в 30 читать и фиксить весь массив» была включена. И, вероятно, она даже работала. Т.к. иногда застукивал том за тем, что она на 100% занят, по показателям диспетчера задач, и на него io плохое. Наверное, что-то он там гонял. Но данные пришлось доставать. ASR-6805 с батарейкой.
Исходная версия dk__, :
Пришло время некропостинга! Некропостинг сам себя не апнет!
Писал я тут ранее:
У меня 6й на 8 дисках. Пока во всем приятнее ссд. Отказы и ребилды репетировал успешно. Но планирую пару лет посидеть без докупок, а потом расширяться зеркальными ссд.
Ну что сказать, беда не приходит одна. Хотя все и кончилось хорошо.
На момент прихода беды я отказался от HS диска и оставил просто R6 на 8 дисках (глупо, да). (Напомню, что его задача - относительно быстрое однопоточное однопользовательское хранилище архивов, не отменяющее бэкапов, но страхующее от аппаратного вылета диска. И цена сильно ниже ссд. И… эти диски у меня уже есть, им от 3 до 5 лет, и будут работать, пока не начнут помирать).
Ну так вот, пересобирал компы. Апгрейд и все такое. К рейду в гости приехал новый проц. Но я не вставил до конца один из кабелей питания дисков. И массив запустился без одного из дисков. Дальше он начал орать (буквально). Я заметил, выключил комп, вставил питание. Массив пошел на типа проверку. Но сделал ее подозрительно быстро (для 16тб то). Потом… этот диск опять отпал. Назад массив его уже не принял. А потом не запустился на авторебилд и на другой диск вставленный вместо проблемного.
Тут я начал очковать, и решил вычитать данные (благо было куда), а потом разбираться с массивом. Начал читать с него… и минут через 20 том пропал из системы. Тут я начал очковать сильно. Потом было попыток 20 запустить ребилд на принудительно созданный HS диск. Но ни в какую из веб гуя он это не делал. А еще полезли какие-то аппаратные проблемы с компом - он начал рандом перезагружаться. С ошибками IOMMU. Заочковал я еще сильнее.
Пошел в прошивку контроллера (до загрузки ОС), там запустил принудительный ребилд. Он прошел его, прошел проверку. И… тома в системе нет! Уже был морально готов вести диски и контроллер в контору по восстановлению, но решил попробовать их R.saver (софтина такая). И, о чудо! Все вычиталось легко и просто. Она быстро собрала виртуальный рейд и дала все прочесть. (R-studio - не смогла нихрена вообще) Из многих сотен тысяч файлов не прочлись всего несколько штук.
После разбора массива выяснилось, что тот диск, с проблемами по питанию - посыпался. Тут уже не узнать - он был такое еще до моих кривых рук, или я его добил. Но вот так.
МОРАЛЬ:
- Самое ценное было в бэкапах. И я молодец.
- Все еще не вижу замены 6му рейду у себя. Выбрасывать пачку рабочих (аптайм от 3 лет) вд редов я не готов. Даже докупил еще.
- Соберу R+HS. +1 диск в шкафу. И отдельно зеркало на 2 дисках (2х16 тб лол, но это медленнее и более рисково).
- Да, при первичной сборке массива я репетировал отказы и ребилды. И хрен оно сработало на реальной проблеме. Но двойная избыточность помогла - данные целы.
Продолжу наблюдения. Да у меня есть ссд, в сумме где-то 6тб. Но этого мало. А еще пару десятков тб - дорого.