LINUX.ORG.RU
решено ФорумAdmin

Миграция на RAID1


0

1

Есть два диска по 1Тб для файлопомойки, второй резервный. Планирую от (не)регулярных бекапов перейти к софт-зеркалу.

Пусть диски будут sdc1(рабочий) и sdd1(резервный), инициализируем рейд без sdc:

mdadm --create /dev/md0 --level 1 --raid-devices=2 missing /dev/sdd1
Создаём фс, переносим данные с sdc на sdd(который уже md0):
mkfs.ext3 /dev/md0
mount /dev/md0 /mnt/data
cp /data/ /mnt/data
Добавляем sdc1:
umount /dev/sdc1
mdadm --add /dev/md0 /dev/sdс1
Если я всё правильно понимаю, после этого начинается cинхронизация sdd1->sdc1. Вопрос: насколько этот процесс критичный? Можно ли потерять данные? Надо ли озаботиться ИБП?

Ну и по эксплуатации: отключения света и прочие неприятности софт-рейд нормально переживает? Или без ИБП и дизеля мне обеспечено много часов сомнительных удовольствий по восстановлению? Поделитесь опытом.

★★★

Последнее исправление: ollowtf (всего исправлений: 1)

>> Планирую от (не)регулярных бекапов перейти к софт-зеркалу.

Честно говоря, после этого уже можно дальше не читать. Заменять хоть какой-то бэкап зеркалом — довольно конченая затея.

Вопрос: насколько этот процесс критичный? Можно ли потерять данные? Надо ли озаботиться ИБП?

UPS, конечно, желателен. Процесс может быть безопасно прерван штатно, write-intent bitmap скорее всего спасёт и при нештатном прерывании, но я не уверен, что это верно для массива в процессе перестроения.

Ну и по эксплуатации: отключения света и прочие неприятности софт-рейд нормально переживает?

Да, легко. Write-intent bitmap позволяет избежать полного ресинка, если что случится. Но стоит подумать о здоровье ФС, так что UPS рекомендуется — как всегда.

GotF ★★★★★
()

> Ну и по эксплуатации: отключения света и прочие неприятности софт-рейд нормально переживает? Или без ИБП и дизеля мне обеспечено много часов сомнительных удовольствий по восстановлению? Поделитесь опытом.

Мой опыт свидетельствует о том, что переживет, но часть данных, которые записывались непосредственно перед концом света потеряются, fsck все ошибки вылечит. Но ибп все равно желателен, тем более что настроить чтобы диски отключались или сервер уходил в hibernate-to-disk при низком заряде ибп не сложно.

soomrack ★★★★★
()

Планирую от (не)регулярных бекапов перейти к софт-зеркалу.

Возможно, но прозвучит странно, но первое не имеет никакого отношения ко второму.

BigAlex ★★★
()

> Планирую от (не)регулярных бекапов перейти к софт-зеркалу.

RAID не является бекапом.

отключения света и прочие неприятности софт-рейд нормально переживает?

А ошибочное удаление нужных данных?

sin_a ★★★★★
()
Ответ на: комментарий от GotF

Всё сложнее, не до конца описал :) Выношу файлопомойку на отдельный сервер, 1 Тб зеркало + 0.5 Тб внешний, для бекапа действительно важных данных. Интересовал именно этап миграции на зеркало. Спасибо, ИБП найден, появилась уверенность :)

soomrack - спасибо.

ollowtf ★★★
() автор топика

После добавления диска sdb1 к массиву пошла синхронизация. По итогу:

# cat /proc/mdstat 
Personalities : [raid1] 
md0 : active raid1 sdb1[2](S) sdc1[1]
      976751936 blocks [2/1] [_U]
      
unused devices: <none>
То есть не то, что должно.
# mdadm -D /dev/md0
/dev/md0:
        Version : 0.90
  Creation Time : Sat Nov 26 22:50:12 2011
     Raid Level : raid1
     Array Size : 976751936 (931.50 GiB 1000.19 GB)
  Used Dev Size : 976751936 (931.50 GiB 1000.19 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Sun Nov 27 22:22:17 2011
          State : clean, degraded
 Active Devices : 1
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 1

           UUID : 28a23d14:85ce0a09:8da69a1b:58d99c7b (local to host natawka)
         Events : 0.12990

    Number   Major   Minor   RaidDevice State
       0       0        0        0      removed
       1       8       33        1      active sync   /dev/sdc1

       2       8       17        -      spare   /dev/sdb1
Полез в messages, в процессе возникла вот такая радость, много раз:
Nov 27 15:29:42 natawka kernel: [75988.862283] ata4.00: exception Emask 0x0 SAct 0x7fffffff SErr 0x0 action 0x0                                                                                            
Nov 27 15:29:42 natawka kernel: [75988.862287] ata4.00: irq_stat 0x40000008                                                                                                                                
Nov 27 15:29:42 natawka kernel: [75988.862290] ata4.00: failed command: READ FPDMA QUEUED                                                                                                                  
Nov 27 15:29:42 natawka kernel: [75988.862296] ata4.00: cmd 60/80:a8:c1:63:40/00:00:37:00:00/40 tag 21 ncq 65536 in                                                                                        
Nov 27 15:29:42 natawka kernel: [75988.862298]          res 41/40:00:eb:63:40/00:00:37:00:00/40 Emask 0x409 (media error) <F>                                                                              
Nov 27 15:29:42 natawka kernel: [75988.862300] ata4.00: status: { DRDY ERR }                                                                                                                               
Nov 27 15:29:42 natawka kernel: [75988.862302] ata4.00: error: { UNC }                                                                                                                                     
Nov 27 15:29:42 natawka kernel: [75988.867010] ata4.00: configured for UDMA/133                                                                                                                            
Nov 27 15:29:42 natawka kernel: [75988.867032] ata4: EH complete
и такая, видимо как итог:
Nov 27 15:30:15 natawka kernel: [76022.234832] raid1: sdc: unrecoverable I/O read error for block 926950656                                                                                                
Nov 27 15:30:15 : [76022.234862] md: md0: recovery done.                                                                                                                                     
Nov 27 15:30:15 natawka kernel: [76022.416321] RAID1 conf printout:                                                                                                                                        
Nov 27 15:30:15 natawka kernel: [76022.416323]  --- wd:1 rd:2                                                                                                                                              
Nov 27 15:30:15 natawka kernel: [76022.416325]  disk 0, wo:1, o:1, dev:sdb1                                                                                                                                
Nov 27 15:30:15 natawka kernel: [76022.416327]  disk 1, wo:0, o:1, dev:sdc1                                                                                                                                
Nov 27 15:30:15 natawka kernel: [76022.418136] RAID1 conf printout:                                                                                                                                        
Nov 27 15:30:15 natawka kernel: [76022.418137]  --- wd:1 rd:2                                                                                                                                              
Nov 27 15:30:15 natawka kernel: [76022.418139]  disk 1, wo:0, o:1, dev:sdc1
Отдельно вывод smartd, до:
Nov 27 12:23:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 3 Currently unreadable (pending) sectors                                                                                                     
Nov 27 12:23:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 3 Offline uncorrectable sectors
и после:
Nov 27 15:53:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 4 Currently unreadable (pending) sectors (changed +1)                                                                                        
Nov 27 15:53:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 3 Offline uncorrectable sectors

Nov 27 17:53:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 6 Currently unreadable (pending) sectors (changed +2)                                                                                        
Nov 27 17:53:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 3 Offline uncorrectable sectors

Nov 27 20:23:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 6 Currently unreadable (pending) sectors                                                                                                     
Nov 27 20:23:35 natawka smartd[2938]: Device: /dev/sdc [SAT], 4 Offline uncorrectable sectors (changed +1)

Я правильно понимаю, что это начало конца для sdc? Прикол в том, что диски одной партии, WD EADS, sdb отпахал ~1 год, ошибок по смарту нет, sdc подключался раз 5-6. Ну и стандартное, что теперь делать? :) Синхронизация, видимо, прошла не до конца. GotF, soomrack, BigAlex, sin_a, выручайте.

ollowtf ★★★
() автор топика
Ответ на: комментарий от ollowtf

>> Я правильно понимаю, что это начало конца для sdc?

Прямо скажем, это уже можно считать концом.

Это uncorrectable, так что скорее всего синхронизацию завершить никак не выйдет. Можешь попробовать запустить ещё раз, но я сомневаюсь, что есть смысл.

GotF ★★★★★
()
Ответ на: комментарий от GotF

Пересобрал с синхронизацией sdb->sdc, ошибок смарта не вылезло.

# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 sdc1[0] sdb1[1]
      976751936 blocks [2/2] [UU]

unused devices: <none>
# mdadm -D /dev/md1
/dev/md1:
        Version : 0.90
  Creation Time : Mon Nov 28 00:01:54 2011
     Raid Level : raid1
     Array Size : 976751936 (931.50 GiB 1000.19 GB)
  Used Dev Size : 976751936 (931.50 GiB 1000.19 GB)
   Raid Devices : 2
  Total Devices : 2
Preferred Minor : 1
    Persistence : Superblock is persistent

    Update Time : Mon Nov 28 15:38:22 2011
          State : clean
 Active Devices : 2
Working Devices : 2
 Failed Devices : 0
  Spare Devices : 0

           UUID : e7fde8a5:c3a2954d:8da69a1b:58d99c7b (local to host natawka)
         Events : 0.7658

    Number   Major   Minor   RaidDevice State
       0       8       33        0      active sync   /dev/sdc1
       1       8       17        1      active sync   /dev/sdb1
Погоняю недельку-две. Если дальше сыпаться не будет, значит WD без использования тухнет. Жутко не хочется по нынешним ценам винт брать. Спасибо за помощь :)

ollowtf ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.