Всем привет.
Есть сервак:
- OS Centos 5.3 - 2 x SATA диска 500Gb (WDC WD5002ABYS-01B1B) - soft raid 1 (mirror)
Регулярно один из зеркалированных разделов (/home из sda1 + sdb1) переходит в read-only режим из-за найденных ошибок, лечится перезагрузкой и проверкой fsck'ом, но причина их появления так и не установлена.
Сама ошибка выглядит так:
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697
Aug 25 12:50:20 kernel: Aborting journal on device md3.
Aug 25 12:50:20 kernel: journal commit I/O error
Aug 25 12:50:20 kernel: ext3_abort called.
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_journal_start_sb: Detected aborted journal
Aug 25 12:50:20 kernel: Remounting filesystem read-only
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697
Aug 25 12:50:20 kernel: EXT3-fs error (device md3): ext3_lookup: unlinked inode 65442296 in dir #65437697
Потом много ошибок такого вида:
Aug 25 12:53:40 kernel: BUG: soft lockup - CPU#0 stuck for 10s! [shutdown:32314]
Aug 25 12:53:40 kernel:
Aug 25 12:53:40 kernel: Pid: 32314, comm: shutdown
Aug 25 12:53:40 kernel: EIP: 0060:[<c049a782>] CPU: 0
Aug 25 12:53:40 kernel: EIP is at dqput+0x88/0x15d
Aug 25 12:53:40 kernel: EFLAGS: 00000246 Not tainted
(2.6.18-128.4.1.el5PAE #1)
Aug 25 12:53:40 kernel: EAX: 00000000 EBX: ec8c7cc0 ECX: f7bce400
EDX: 00000002
Aug 25 12:53:40 kernel: ESI: ec8c7cc0 EDI: f7bce4e4 EBP: ffffffff
DS: 007b ES: 007b
Aug 25 12:53:40 kernel: CR0: 8005003b CR2: 0814b340 CR3: 1b0b87e0 CR4: 000006f0
Aug 25 12:53:40 kernel: [<c049bc5a>] vfs_quota_sync+0x9b/0x131
Aug 25 12:53:40 kernel: [<c049d9e1>] quota_sync_sb+0x11/0xcc
Aug 25 12:53:40 kernel: [<c049db48>] sync_dquots+0xac/0xed
Aug 25 12:53:40 kernel: [<c04737d8>] do_sync+0x1b/0x55
Aug 25 12:53:40 kernel: [<c047381c>] sys_sync+0xa/0xd
Aug 25 12:53:40 kernel: [<c0404f17>] syscall_call+0x7/0xb
Aug 25 12:53:40 kernel: =======================
- В логах никаких ошибок кроме указанной нету
- S.M.A.R.T. обоих дисков девственно чистый
- bablocks обоих дисков и всего рейд раздела, ничего не находит
- В /etc/mdstat с рейдом все нормально
- Серваку несколько месяцев, диски и железо новое, питание от UPS, охлаждение и т.п. все как положено.
Есть идеи куда копать?