LINUX.ORG.RU

Сообщения lorret

 

Замена диска nvme в массиве RAID 1 mdadm проблема с разделами дисков

Всем добрый вечер! Немного предыстории. Достался по наследству сервер на ubuntu 22.04 на котором собрано 3 разных софтовых массивах спомощью mdadm RAID 1 на 2-х nvme дисках, RAID 1 на 2 SSD и RAID 5 на 4-х SSD.

Проблема в следующем: в один прекрасный момент получил уведомление в заббикс mdadm degraded. Полез на сервер смотреть что к чему. Собственно это и был первый раз когда я вообще зашел на эту железку (руки не доходили до неё).

Глянул что там по дискам и увидел что из массива RAID1 /dev/md0 выпал один nvme диск. mdadm –detail /dev/md0 выдал

1 диск active sync /dev/nvme0n1p2 2 диск removed

Что как было изначально собрано я не знал и разбираться пришлось уже по ходу дела. Для себя выяснил что было 2 одинаковых nvme которые в системе значились как nvme0n1 и nvme1n1 (скорее всего, других вариантов у меня нет) На дисках было по 2 раздела: /dev/nvme0n1 – nvme0n1p1 и nvme0n1p2 /dev/nvme1n1 – nvme1n1p1 и nvme1n1p2 (если мыслить логически. Если моя логика неверна просьба поправить т.к. ранее я по сути и не работал с софтовыми массивами на лине) Сам массив как я понял был собран именно на разделах nvme0n1p2 и nvme1n1p2.

nvme0n1p1 и nvme1n1p1 видимо были загрузчиками но не были в массиве.

Что было сделано:

  1. Система сама пометила диск как сбойный и удалила его из массива.
  2. Диск был заменен на новый аналогичный (разметку я никакую не делал)
  3. Поискал в инете иструкций (не уверен что правильных) и приступил к делу.

Нашел новый установленный диск он назывался nvme1n1

Скопировал с nvme0n1 разделы на nvme1n1 командой sudo sgdisk -R=/dev/nvme1n1 /dev/nvme0n1 (возможно это не правильно). Разделы скопировались вроде все ок. К сожалению ничего не проверил и добавил раздел nvme1n1p2 к массиву md0. Прошел ребилд и вроде все ок в массиву стало 2 раздела nvme0n1p2 и nvme1n1p2.

А вот с загрузчиками (если я правильно понимаю что это они) nvme0n1p1 и nvme1n1p2 возникли какие то непонятки…. nvme0n1p1 (который я вообще никак не трогал т.к. это раздел был работающего диска) по команде blkid /dev/nvme0n1p1 выдавал следующую инфу : /dev/nvme0n1p1:UUID=«9FB0-12FB» BLOCK_SIZE=«512» TYPE=«vfat» PARTUUID=«5996d0c5-8818-45d0-8e9b-442a5b4b84db»

а по команде blkid /dev/nvme1n1p1: PTUUID=«3641b938-26ea-40b1-a070-ec3a9174f71e» PPTYPE=«gpt» PARTUUID=«5996d0c5-8818-45d0-8e9b-442a5b4b84db»

Собственно на этом моменте я и завис… Я не особо понимаю должны эти разделы в итоге быть одинаковыми по своей структуре и почему в первом тип указан vfat а на втором pptype = gpt если раздел копировался с живого диска. И не могу пока что понять как это может повлиять в дальнейшем на работу системы. Кстати была еще ошибка после замены диска при старте системы что она не может примонтировать раздел (по я потом закоментил эту строку в fstab и ошибка ушла. в fstab значился диск тоже с коротким UUID примерно как на первом диске 9FB0-12FB только естествено он был другой, поэтому у меня и было предположение что раздел на новом диске тоже должен быть в vfat.

p.s. в линухах я особо не силен поэтому прошу помощи у знающих, или хотя бы направить в нужное русло. Заранее Спасибо

 , , ,

lorret
()

RSS подписка на новые темы