Сегодня день начался с ошибок segfault - начал валится php-fpm. Как оказалось не только php-fpm, но и прочий софт, например apt-get update отваливается с ошибками.
На текущий момент пришел к выводу, что это из-за диких тормозов дисковой подсистемы:
root@ptex:/var/log/fsck# hdparm -t /dev/sda /dev/sda: Timing buffered disk reads: 4 MB in 3.00 seconds = 1.33 MB/sec root@ptex:/var/log/fsck# hdparm -t /dev/sdb /dev/sdb: Timing buffered disk reads: 4 MB in 4.13 seconds = 991.98 kB/sec root@ptex:/var/log/fsck# hdparm -t /dev/md0 /dev/md0: Timing buffered disk reads: 4 MB in 4.38 seconds = 935.65 kB/sec root@ptex:/var/log/fsck# hdparm -i /dev/sda /dev/sda: Model=ST500DM002-1BD142, FwRev=KC45, SerialNo=Z3T3TKNH Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs RotSpdTol>.5% } RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4 BuffType=unknown, BuffSize=16384kB, MaxMultSect=16, MultSect=16 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=976773168 IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120} PIO modes: pio0 pio1 pio2 pio3 pio4 DMA modes: mdma0 mdma1 mdma2 UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6 AdvancedPM=no WriteCache=enabled Drive conforms to: unknown: ATA/ATAPI-4,5,6,7 * signifies the current active mode root@ptex:/var/log/fsck# hdparm -i /dev/sdb /dev/sdb: Model=ST500DM002-1BD142, FwRev=KC45, SerialNo=Z3T3VHAQ Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs RotSpdTol>.5% } RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4 BuffType=unknown, BuffSize=16384kB, MaxMultSect=16, MultSect=16 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=976773168 IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120} PIO modes: pio0 pio1 pio2 pio3 pio4 DMA modes: mdma0 mdma1 mdma2 UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6 AdvancedPM=no WriteCache=enabled Drive conforms to: unknown: ATA/ATAPI-4,5,6,7 * signifies the current active mode
Пробовал поменять опцию bitmap, удалить-добавить устройство в RAID (как написано в #5 тут: http://www.cyberciti.biz/tips/linux-raid-increase-resync-rebuild-speed.html ), но не помогло.
Вывод инфы, касающейся mdadm:
root@ptex:/var/log/fsck# mdadm -D /dev/md0 /dev/md0: Version : 0.90 Creation Time : Fri Oct 26 22:39:25 2012 Raid Level : raid1 Array Size : 488386496 (465.76 GiB 500.11 GB) Used Dev Size : 488386496 (465.76 GiB 500.11 GB) Raid Devices : 2 Total Devices : 2 Preferred Minor : 0 Persistence : Superblock is persistent Update Time : Sat Apr 12 14:30:19 2014 State : clean, degraded, recovering Active Devices : 1 Working Devices : 2 Failed Devices : 0 Spare Devices : 1 Rebuild Status : 26% complete UUID : 157b06cd:e27f8486:c3ede18e:95b605a2 (local to host ptex) Events : 0.3522 Number Major Minor RaidDevice State 2 8 16 0 spare rebuilding /dev/sdb 1 8 0 1 active sync /dev/sda root@ptex:/var/log/fsck# cat /proc/mdstat Personalities : [raid1] md0 : active raid1 sdb[2] sda[1] 488386496 blocks [2/1] [_U] [=====>...............] recovery = 27.7% (135474560/488386496) finish=95.3min speed=61670K/sec unused devices: <none>