LINUX.ORG.RU
ФорумAdmin

Замена дисков


0

1

Добрый день! Есть винты, работают уже достаточно долго на сервере. Когда брал только сервер все работало отлично, сервер работал даже без глюков если был запущен бэкап. Сейчас начались проблемы, что сервер начинает долго откликаться при бэкапах и тд. Думаю попросить дц все таки заменить винты, собран рейд 1. Получается беру помечаю как 1 диск сбойнутый удаляю из рейда, меняют и делаю синхронизацию винтов, потом помечаю 2 диск как сбойнутый и тоже меняю и делаю синхронизацию. Или есть проще варианты?

Спасибо


начинает долго откликаться при бэкапах

Дык неудивительно, магии не существует.

Прежде чем менять диски убедись что именно в них проблема, может и не они виноваты.

Или есть проще варианты?

Можно не помечать диски как нерабочие, а сразу выдирать из сервера :) Но лучше так не делать. Вывел из рейда, отключил питание, поставил новый диск, рескан шины, добавил в рейд. Не забываем что процесс ресинка, в зависимости от дисков и нагрузки - процесс не быстрый.

technoid
()

сперва в смарт дискам посмотри, скорее всего надо тюнить дисковый ввод-вывод, а не менять диски

anonymous
()

все так, только имеет смысл сначала логи на предмет ошибок дисков глянуть и нагрузку, мож у тебя там все ядра архивы жмут или рабочие запросы с бэкапом за io дерутся.

anonymous
()
Ответ на: комментарий от anonymous

1 винт

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   145   145   021    Pre-fail  Always       -       3708
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       32
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   088   088   000    Old_age   Always       -       9015
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       31
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       21
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       10
194 Temperature_Celsius     0x0022   116   107   000    Old_age   Always       -       27
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

2 винт

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   143   142   021    Pre-fail  Always       -       3808
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       55
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   078   078   000    Old_age   Always       -       16335
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       52
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       42
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       12
194 Temperature_Celsius     0x0022   115   102   000    Old_age   Always       -       28
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       9

Помню, год назад, была такая проблема при создании бэкапов. И буквально через месяц умер винт. Наработка часов уже 2 винта приличная.

LinuxUs
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.