LINUX.ORG.RU
решено ФорумAdmin

Ужасно стал торимозить raid1 (soft)


0

3

Как то стал ториозить серв на centos. увидел что вылетел один винт из рейда. закинул его назад пошла синхронихация, а тормоза остались. В чем может быть причина?

  503 be/4 root        0.00 B/s    0.00 B/s  0.00 % 99.99 % [md2_raid1]
  514 be/3 root        0.00 B/s    0.00 B/s  0.00 % 99.99 % [jbd2/md2-8]
    1 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % init
    2 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [kthreadd]
    3 rt/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [migration/0]
    4 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [ksoftirqd/0]
    5 rt/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [migration/0]
    6 rt/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [watchdog/0]

  503 be/4 root        0.00 B/s    0.00 B/s  0.00 % 99.99 % [md2_raid1]
13658 be/4 mysql       0.00 B/s  930.16 M/s  0.00 %  0.00 % mysqld --~mysql.sock
 1133 be/4 root        0.00 B/s  472.80 K/s  0.00 %  0.00 % [flush-9:2]
    1 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % init
    2 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % [kthreadd]



Последнее исправление: pissed (всего исправлений: 2)

Ответ на: комментарий от sidor

синхронизация уже прошла.

Personalities : [raid1]
md2 : active raid1 sda3[0] sdb3[1]
      729952120 blocks super 1.0 [2/2] [UU]

md1 : active raid1 sda2[0] sdb2[1]
      524276 blocks super 1.0 [2/2] [UU]

md0 : active raid1 sda1[0] sdb1[1]
      2096116 blocks super 1.0 [2/2] [UU]

unused devices: <none>

pissed
() автор топика
Ответ на: комментарий от pissed

Ну может кто-то активно диск юзает. Глянь iotop-ом (если шестёрка). Ну или atop -d (если пятёрка)

sidor ★★
()
Ответ на: комментарий от petav

не известо почему.

Device Model:     WDC WD7500AALX-009BA0
Serial Number:    WD-WCATR7094682
Firmware Version: 15.01H15
User Capacity:    750,156,374,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Wed Nov 14 11:10:05 2012 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   181   181   021    Pre-fail  Always       -       3941
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       11359
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       12
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       10
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       3
194 Temperature_Celsius     0x0022   104   103   000    Old_age   Always       -       43
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
Device Model:     WDC WD7500AALX-009BA0
Serial Number:    WD-WCATR7091843
Firmware Version: 15.01H15
User Capacity:    750,156,374,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Wed Nov 14 11:10:27 2012 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled



SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       80
  3 Spin_Up_Time            0x0027   180   180   021    Pre-fail  Always       -       3958
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       14
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   085   085   000    Old_age   Always       -       11387
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       12
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       10
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       3
194 Temperature_Celsius     0x0022   108   107   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       78

pissed
() автор топика
Ответ на: комментарий от pissed

Write Error Rate / Multi-Zone Error Rate

Показывает общее количество ошибок, происходящих при записи сектора. Показывает общее число ошибок записи на диск. Может служить показателем качества поверхности и механики накопителя.

S.M.A.R.T.

petav ★★★★★
()
Ответ на: комментарий от petav

Вынул диск из массива история продолжается.

Personalities : [raid1]
md2 : active raid1 sda3[0]
      729952120 blocks super 1.0 [2/1] [U_]

md1 : active raid1 sda2[0]
      524276 blocks super 1.0 [2/1] [U_]

md0 : active raid1 sda1[0]
      2096116 blocks super 1.0 [2/1] [U_]

unused devices: <none>

  514 be/3 root        0.00 B/s    0.00 B/s  0.00 % 99.98 % [jbd2/md2-8]
  503 be/4 root        0.00 B/s    0.00 B/s  0.00 % 95.68 % [md2_raid1]
    1 be/4 root        0.00 B/s    0.00 B/s  0.00 %  0.00 % init
так и должно быть?

pissed
() автор топика
Ответ на: комментарий от pissed

Какой из этих двух дисков вывалился? Что есть интересного в /var/log/messages о причинах исключения диска из массива?

fjoe
()
Ответ на: комментарий от fjoe
Oct 30 07:53:11 CentOS-60-64-minimal kernel: sd 1:0:0:0: [sdb] Unhandled error code
Oct 30 07:53:11 CentOS-60-64-minimal kernel: sd 1:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
Oct 30 07:53:11 CentOS-60-64-minimal kernel: sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 50 d0 05 00 00 00 08 00
Oct 30 07:53:11 CentOS-60-64-minimal kernel: end_request: I/O error, dev sdb, sector 1355810048
Oct 30 07:53:11 CentOS-60-64-minimal kernel: md/raid1:md2: Disk failure on sdb3, disabling device.
Oct 30 07:53:11 CentOS-60-64-minimal kernel: md/raid1:md2: Operation continuing on 1 devices.
sd 1:0:0:0: [sdb] Unhandled error code
sd 1:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 51 d9 ac a0 00 00 08 00
end_request: I/O error, dev sdb, sector 1373220000
sd 1:0:0:0: [sdb] Unhandled error code
sd 1:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
sd 1:0:0:0: [sdb] CDB: Write(10): 2a 00 56 6c 5e e0 00 00 10 00
end_request: I/O error, dev sdb, sector 1449942752

Вывалился /dev/sdb.

pissed
() автор топика
Ответ на: комментарий от pissed

Нет, это я о причинах отпадания диска. Сыпется он у тебя.

YAR ★★★★★
()
Ответ на: комментарий от pissed

iostat -dxk 5 - нагрузка на устройства. htop - покажет кто из процессов использует I/O (в настройках добавить столбцы с данными I/O по вкусу)

Вывалился /dev/sdb.

И как понять какие SMART данные к нему относятся? Там два выхлопа без опознавательных знаков.

Нет, это я о причинах отпадания диска. Сыпется он у тебя.

YAR: как так SMART это пропустил? Или я не туда смотрю? Вот эти параметры - Reallocated_Sector_Ct, Reallocated_Event_Count и Current_Pending_Sector.

anonymous
()
Ответ на: комментарий от anonymous

А хз. Может после этого и появится. А может что-то внешнее спровоцировало ошибку чтения этих секторов. В любом случае, не мешало бы прогнать тесты на отвалившемся винте.

YAR ★★★★★
()
Ответ на: комментарий от pissed

Последняя строка в RAW data имеет не самые лестные представления. Хотя ничего криминального пока нету.

DALDON ★★★★★
()
Последнее исправление: DALDON (всего исправлений: 1)
Ответ на: комментарий от pissed

Почему из вывода обрезано всё что относится к логам и self-тестам SMART'а? Может у вас сейчас диск самотестируется.

mky ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.