LINUX.ORG.RU
ФорумAdmin

BUG: soft lockup detected on CPU#2


0

0

Здравствуйте уважаемые коллеги!

Имеем сервер с четырьмя оптеронами и на нём стоит CenOS 5 со всеми последними патчами.

[root@db03 ~]# uname -a
Linux db03 2.6.18-8.1.8.el5 #1 SMP Tue Jul 10 06:39:17 EDT 2007 x86_64 x86_64 x86_64 GNU/Linux

Когда делаем mkfs.ext3 на раиде, то получаем

BUG: soft lockup detected on CPU#2!

Call Trace:
 <IRQ>  [<ffffffff800b2ca3>] softlockup_tick+0xdb/0xed
 [<ffffffff80093424>] update_process_times+0x42/0x68
 [<ffffffff80073d99>] smp_local_timer_interrupt+0x23/0x47
 [<ffffffff8007445b>] smp_apic_timer_interrupt+0x41/0x47
 [<ffffffff8005bcc2>] apic_timer_interrupt+0x66/0x6c
 <EOI>  [<ffffffff80062598>] _spin_lock+0x3/0xa
 [<ffffffff800270dc>] try_to_free_buffers+0x55/0x9d
 [<ffffffff80043041>] invalidate_mapping_pages+0x90/0x15f
 [<ffffffff800d4abe>] kill_bdev+0xe/0x21
 [<ffffffff800d4fe4>] __blkdev_put+0x4f/0x169
 [<ffffffff80012281>] __fput+0xae/0x198
 [<ffffffff80023647>] filp_close+0x5c/0x64
 [<ffffffff8001d5cd>] sys_close+0x88/0xa2
 [<ffffffff8005b2c1>] tracesys+0xd1/0xdc

Воспроизводится 100% 
Что это - kernel bug?

Google подсказывает, что у вас проблемы с железом. Также проверьте содержимое /var/log/messages и dmesg

Если можете, попробуйте vanilla 2.6.22.x

birdie ★★★★★
()
Ответ на: комментарий от birdie

в /var/log/messages и dmesg одно и то же сообщение

vanilla 2.6.22.x - щас попробую.

sjb
() автор топика
Ответ на: комментарий от birdie

И где это видно однозначно, что проблемы с железом а не баг в ядре?

Я чего-то не понимаю.

sjb
() автор топика
Ответ на: комментарий от j262

А железо у тебя какое?
 Уменя HP DL585 - 4x процессорный

processor       : 0
vendor_id       : AuthenticAMD
cpu family      : 15
model           : 65
model name      : Dual-Core AMD Opteron(tm) Processor 8218
stepping        : 2
cpu MHz         : 1000.000
cache size      : 1024 KB
physical id     : 0
siblings        : 2
core id         : 0
cpu cores       : 2
fpu             : yes
fpu_exception   : yes
cpuid level     : 1
wp              : yes
flags           : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt rdtscp lm 3bogomips        : 2009.26
TLB size        : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 40 bits physical, 48 bits virtual
power management: ts fid vid ttp tm stc

sjb
() автор топика

Это не проблема с железом, это скорее баг в ядре - нить слишком долго занимает процессор. Если система не зависает, и оба проца работают - считай это сообщение false positive.

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Система не зависает. ext3 на раиде после этого создаётся, fsck потом ошибок не находит, только это вот сообщение подозрительное.

А где можно почитать какой-нибудь учебник по теме? по ядру 2.6?

sjb
() автор топика
Ответ на: комментарий от birdie

> Если можете, попробуйте vanilla 2.6.22.x

ставить RHEL и накатывать на него убогое vanila kernel это конечно умно, ничего не скажешь

Reset ★★★★★
()
Ответ на: комментарий от sjb

> А где можно почитать какой-нибудь учебник по теме? по ядру 2.6?

Смотря что тебе нужно... Я читал LDD3 и Documentation/, есть еще книга R.Love "Programming Linux Kernel"

tailgunner ★★★★★
()
Ответ на: комментарий от Reset

>> Если можете, попробуйте vanilla 2.6.22.x

> ставить RHEL и накатывать на него убогое vanila kernel

Поделишься списком фичей, которые есть в ядре RHEL5, но отсуствуют в 2.6.22?

tailgunner ★★★★★
()
Ответ на: комментарий от tailgunner

Насколько я понял, там ядро скомпилено для Generic-x86-64. Попробую перекомпилить для оптерона.

sjb
() автор топика
Ответ на: комментарий от sjb

Перекомпилил для оптерона, но ошибка осталась.

Попробую vanilla kernel.

sjb
() автор топика
Ответ на: комментарий от birdie

Перекомпилил vanilla kernel - с ним проблем нет. Получается редхатовские ядра не успевают даже брать багфиксы со стандартного ядра?

sjb
() автор топика
Ответ на: комментарий от sjb

У вас куплена поддержка на RHEL? Звоните и трахайте им мозг.

birdie ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.