LINUX.ORG.RU

Зависание ядра


0

1

Доброго времени суток!

Возникает довольно странная ситуация - при загрузке ядро зависает на 5 минут, после чего пордолжает работать без видимых проблем. Причем, такое происходит не всегда, но очень часто.

система Debian 64, ядро 3.0.1 ванильное (с 3.0.0.1 из репов аналогичная ситуация, с 2,6,32 - все нормально). GA-MA780G-UD3G, Athlon2x2
выдкржка и dmesg:

[ 2.017211] usbcore: registered new interface driver usbhid
[ 2.017212] usbhid: USB HID core driver
[ 2.084429] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
[ 2.132149] INFO: rcu_sched_state detected stalls on CPUs/tasks: { 0} (detected by 1, t=74992 jiffies)
[ 2.132149] sending NMI to all CPUs:
[ 2.132139] NMI backtrace for cpu 0
[ 2.132139] CPU 0
[ 2.132139] Modules linked in: usbhid hid ext4 mbcache jbd2 crc16 sg sd_mod crc_t10dif ata_generic pata_atiixp ohci_hcd ahci libahci libata r8169 mii ehci_hcd scsi_mod usbcore [last unloaded: scsi_wait_scan]
[ 2.132139]
[ 2.132139] Pid: 0, comm: swapper Not tainted 3.0.1 #1 Gigabyte Technology Co., Ltd. GA-MA780G-UD3H/GA-MA780G-UD3H
[ 2.132139] RIP: 0010:[<ffffffff8131f311>] [<ffffffff8131f311>] _raw_spin_lock_irqsave+0x1e/0x25
[ 2.132139] RSP: 0018:ffffffff81601e08 EFLAGS: 00000097
[ 2.132139] RAX: 0000000000000002 RBX: ffffffff8177b8a0 RCX: 000000000000114b
[ 2.132139] RDX: 000000000000114c RSI: 0000000000000005 RDI: ffffffff8177b8a0
[ 2.132139] RBP: ffff88012fc0dd40 R08: 0000000000000000 R09: 0000000000000000
[ 2.132139] R10: 0000000000000046 R11: 0000000000000100 R12: 0000000000000000
[ 2.132139] R13: ffffffff81611340 R14: 0000000000000005 R15: 0000000000000000
[ 2.132139] FS: 00007f8ebc2f07a0(0000) GS:ffff88012fc00000(0000) knlGS:0000000000000000
[ 2.132139] CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[ 2.132139] CR2: 00007f8ebb9d3d90 CR3: 0000000125c75000 CR4: 00000000000006f0
[ 2.132139] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[ 2.132139] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[ 2.132139] Process swapper (pid: 0, threadinfo ffffffff81600000, task ffffffff8160b020)
[ 2.132139] Stack:
[ 2.132139] ffffffff81601f14 ffffffff810682c0 ffffffff81601f14 0000000000000001
[ 2.132139] 00000000ffffffff 0000000000000000 000000000008c800 ffffffff81067c69
[ 2.132139] ffffffff8160b3d8 00ff88012fc12840 ffffffff8160b020 ffffffff81601f14
[ 2.132139] Call Trace:
[ 2.132139] [<ffffffff810682c0>] ? tick_broadcast_oneshot_control+0x54/0x102
[ 2.132139] [<ffffffff81067c69>] ? tick_notify+0x210/0x367
[ 2.132139] [<ffffffff81322339>] ? notifier_call_chain+0x2e/0x5b
[ 2.132139] [<ffffffff810673eb>] ? clockevents_notify+0x2f/0x13b
[ 2.132139] [<ffffffff8100ef24>] ? amd_e400_idle+0xd3/0xe4
[ 2.132139] [<ffffffff81008251>] ? cpu_idle+0x9d/0xd7
[ 2.132139] [<ffffffff8169fb3b>] ? start_kernel+0x3bd/0x3c8
[ 2.132139] [<ffffffff8169f140>] ? early_idt_handlers+0x140/0x140
[ 2.132139] [<ffffffff8169f3c4>] ? x86_64_start_kernel+0x104/0x111
[ 2.132139] Code: c0 0f 95 c0 0f b6 c0 c3 e9 0f e4 d4 ff 53 48 89 fb e8 d4 e3 d4 ff ba 00 00 01 00 f0 0f c1 13 0f b7 ca c1 ea 10 39 d1 74 07 f3 90 <0f> b7 0b eb f5 5b c3 51 48 89 3c 24 e8 a6 e3 d4 ff 48 8b 3c 24
[ 2.132139] Call Trace:
[ 2.132139] [<ffffffff810682c0>] ? tick_broadcast_oneshot_control+0x54/0x102
[ 2.132139] [<ffffffff81067c69>] ? tick_notify+0x210/0x367
[ 2.132139] [<ffffffff81322339>] ? notifier_call_chain+0x2e/0x5b
[ 2.132139] [<ffffffff810673eb>] ? clockevents_notify+0x2f/0x13b
[ 2.132139] [<ffffffff8100ef24>] ? amd_e400_idle+0xd3/0xe4
[ 2.132139] [<ffffffff81008251>] ? cpu_idle+0x9d/0xd7
[ 2.132139] [<ffffffff8169fb3b>] ? start_kernel+0x3bd/0x3c8
[ 2.132139] [<ffffffff8169f140>] ? early_idt_handlers+0x140/0x140
[ 2.132139] [<ffffffff8169f3c4>] ? x86_64_start_kernel+0x104/0x111
[ 2.132149] NMI backtrace for cpu 1
[ 2.132149] CPU 1
[ 2.132149] Modules linked in: usbhid hid ext4 mbcache jbd2 crc16 sg sd_mod crc_t10dif ata_generic pata_atiixp ohci_hcd ahci libahci libata r8169 mii ehci_hcd scsi_mod usbcore [last unloaded: scsi_wait_scan]

[ 2.132149]
[ 2.132149] Pid: 0, comm: kworker/0:0 Not tainted 3.0.1 #1 Gigabyte Technology Co., Ltd. GA-MA780G-UD3H/GA-MA780G-UD3H
[ 2.132149] RIP: 0010:[<ffffffff8119cfce>] [<ffffffff8119cfce>] __bitmap_empty+0x2/0x52
[ 2.132149] RSP: 0018:ffff88012fc43d20 EFLAGS: 00000046
[ 2.132149] RAX: 0000000000000200 RBX: 0000000000002710 RCX: 00000000000007c4
[ 2.132149] RDX: 0000000000000000 RSI: 0000000000000200 RDI: ffffffff81683e40
[ 2.132149] RBP: ffffffff8161d900 R08: 0000000000000002 R09: 0000000000000000
[ 2.132149] R10: 0000000000000800 R11: 0000000000000800 R12: ffffffff8161da00
[ 2.132149] R13: ffffffff8161fa00 R14: 0000000000000000 R15: ffffffff8161fa00
[ 2.132149] FS: 00007f8ebc2f07a0(0000) GS:ffff88012fc40000(0000) knlGS:0000000000000000
[ 2.132149] CS: 0010 DS: 0000 ES: 0000 CR0: 000000008005003b
[ 2.132149] CR2: 00007f8ebb511ff1 CR3: 0000000001603000 CR4: 00000000000006e0
[ 2.132149] DR0: 0000000000000000 DR1: 0000000000000000 DR2: 0000000000000000
[ 2.132149] DR3: 0000000000000000 DR6: 00000000ffff0ff0 DR7: 0000000000000400
[ 2.132149] Process kworker/0:0 (pid: 0, threadinfo ffff880128f66000, task ffff880128f380c0)
[ 2.132149] Stack:
[ 2.132149] ffffffff8101ee6f ffff88012fc4ee40 ffffffff8108fc91 ffff880128f380c0
[ 2.132149] 0000000000000001 0000000000000000 0000000000000001 ffff88012fc43e30
[ 2.132149] 7fffffffffffffff ffffffff81068a98 ffffffff81090109 ffff880128f380c0
[ 2.132149] Call Trace:
[ 2.132149] <IRQ>
[ 2.132149] [<ffffffff8101ee6f>] ? arch_trigger_all_cpu_backtrace+0x5e/0x7b
[ 2.132149] [<ffffffff8108fc91>] ? __rcu_pending+0x1f5/0x2f6
[ 2.132149] [<ffffffff81068a98>] ? tick_nohz_handler+0xd0/0xd0
[ 2.132149] [<ffffffff81090109>] ? rcu_check_callbacks+0x7e/0xae
[ 2.132149] [<ffffffff8104fa78>] ? update_process_times+0x31/0x63
[ 2.132149] [<ffffffff81068b02>] ? tick_sched_timer+0x6a/0x90
[ 2.132149] [<ffffffff8105eca3>] ? __run_hrtimer+0xac/0x135
[ 2.132149] [<ffffffff8105f3d3>] ? hrtimer_interrupt+0xdb/0x195
[ 2.132149] [<ffffffff81067e2b>] ? tick_do_broadcast.constprop.4+0x3f/0x85
[ 2.132149] [<ffffffff81067f2d>] ? tick_handle_oneshot_broadcast+0xbc/0xfa
[ 2.132149] [<ffffffff8100ae45>] ? timer_interrupt+0x15/0x1c
[ 2.132149] [<ffffffff8108b856>] ? handle_irq_event_percpu+0x50/0x180
[ 2.132149] [<ffffffff8100df39>] ? read_tsc+0x5/0x14
[ 2.132149] [<ffffffff81062cd3>] ? timekeeping_get_ns+0xd/0x2a
[ 2.132149] [<ffffffff8108b9ba>] ? handle_irq_event+0x34/0x52
[ 2.132149] [<ffffffff8108d833>] ? handle_edge_irq+0x9f/0xc6
[ 2.132149] [<ffffffff8100a82d>] ? handle_irq+0x1d/0x21
[ 2.132149] [<ffffffff8100a55d>] ? do_IRQ+0x42/0x98
[ 2.132149] [<ffffffff8131f653>] ? common_interrupt+0x13/0x13
[ 2.132149] <EOI>
[ 2.132149] [<ffffffff810251e0>] ? native_safe_halt+0x2/0x3
[ 2.132149] [<ffffffff8100ee19>] ? default_idle+0x47/0x7f
[ 2.132149] [<ffffffff8100ef10>] ? amd_e400_idle+0xbf/0xe4
[ 2.132149] [<ffffffff81008251>] ? cpu_idle+0x9d/0xd7
[ 2.132149] [<ffffffff8106d6c2>] ? arch_local_irq_restore+0x2/0x8
[ 2.132149] [<ffffffff81311e96>] ? start_secondary+0x1d5/0x1db
[ 2.132149] Code: 24 40 48 89 44 24 10 48 8d 44 24 20 4c 89 4c 24 48 c7 44 24 08 10 00 00 00 48 89 44 24 18 e8 5a ff ff ff 48 83 c4 58 c3 90 89 f0 <b9> 40 00 00 00 99 f7 f9 31 d2 eb 0b 48 ff c2 48 83 7c d7 f8 00
[ 2.132149] Call Trace:
[ 2.132149] <IRQ> [<ffffffff8101ee6f>] ? arch_trigger_all_cpu_backtrace+0x5e/0x7b
[ 2.132149] [<ffffffff8108fc91>] ? __rcu_pending+0x1f5/0x2f6
[ 2.132149] [<ffffffff81068a98>] ? tick_nohz_handler+0xd0/0xd0
[ 2.132149] [<ffffffff81090109>] ? rcu_check_callbacks+0x7e/0xae
[ 2.132149] [<ffffffff8104fa78>] ? update_process_times+0x31/0x63
[ 2.132149] [<ffffffff81068b02>] ? tick_sched_timer+0x6a/0x90
[ 2.132149] [<ffffffff8105eca3>] ? __run_hrtimer+0xac/0x135
[ 2.132149] [<ffffffff8105f3d3>] ? hrtimer_interrupt+0xdb/0x195
[ 2.132149] [<ffffffff81067e2b>] ? tick_do_broadcast.constprop.4+0x3f/0x85
[ 2.132149] [<ffffffff81067f2d>] ? tick_handle_oneshot_broadcast+0xbc/0xfa
[ 2.132149] [<ffffffff8100ae45>] ? timer_interrupt+0x15/0x1c
[ 2.132149] [<ffffffff8108b856>] ? handle_irq_event_percpu+0x50/0x180
[ 2.132149] [<ffffffff8100df39>] ? read_tsc+0x5/0x14
[ 2.132149] [<ffffffff81062cd3>] ? timekeeping_get_ns+0xd/0x2a
[ 2.132149] [<ffffffff8108b9ba>] ? handle_irq_event+0x34/0x52
[ 2.132149] [<ffffffff8108d833>] ? handle_edge_irq+0x9f/0xc6
[ 2.132149] [<ffffffff8100a82d>] ? handle_irq+0x1d/0x21
[ 2.132149] [<ffffffff8100a55d>] ? do_IRQ+0x42/0x98
[ 2.132149] [<ffffffff8131f653>] ? common_interrupt+0x13/0x13
[ 2.132149] <EOI> [<ffffffff810251e0>] ? native_safe_halt+0x2/0x3
[ 2.132149] [<ffffffff8100ee19>] ? default_idle+0x47/0x7f
[ 2.132149] [<ffffffff8100ef10>] ? amd_e400_idle+0xbf/0xe4
[ 2.132149] [<ffffffff81008251>] ? cpu_idle+0x9d/0xd7
[ 2.132149] [<ffffffff8106d6c2>] ? arch_local_irq_restore+0x2/0x8
[ 2.132149] [<ffffffff81311e96>] ? start_secondary+0x1d5/0x1db
[ 302.236150] usb 4-1: new low speed USB device number 2 using ohci_hcd

Подскажите, куда копать?
Спасибо!

kirichenkoga
() автор топика
Ответ на: комментарий от ArtSh

пробовал, не помогает.

Система развисает, если выдернуть usb ВО ВРЕМЯ зависания. Я так понимаю, в этом случае происходит прерывание, которые «будит» залипшее ядро. Причем выдергивание не всегда помогает, приходится выдергивать второе. Сейчас подключены usb мышь, клава и вебкамера.

Очевидный вариант - попробовать сделать биссекцию между 32 и 3.0 ядром, но на это придется убить несколько вечеров, чего не хотелось бы.

kirichenkoga
() автор топика

>система Debian 64,

ядро 3.0.1 ванильное

Зачем? «Руки не для скуки»?

Led ★★★☆☆
()

Первым делом загрузиться без USB устройств вообще. Если не помогло отключить контроллер в БИОСе или удалить модули *_hcd (понадобится: или PS/2 клава, или ssh). Дальше по ситуации - если виноват ЮСБ то копать в плане совместимости (поменять девайс) или багов в чипсете (багрепорт+внешний контроллер), если нет то...

x-com
()
Ответ на: комментарий от ArtSh

не похоже на usb, оно на RCU матюкается, там 3.0.3 уже на дворе, попробуй может уже поправили.

GHhost
()
Ответ на: комментарий от x-com

Пробовал без USB устройств - не помогает. Вполне возможно, что баг хардварный, но с ядром 32 все работает нормально

kirichenkoga
() автор топика
Ответ на: комментарий от kirichenkoga

У меня на стационарнике изредка такое бывает - только «развисает» при «тыкании» по клавиатуре (RFR14, upstart). Последний раз было буквально вчера, при этом лагала проводная сеть и загрузка с флэшки. Помогла приборка в системнике и переконфигурация BIOS'а. Единственное, на что могу грешить, так это самопроизвольный сброс BIOS'а в дефолт. Жена сказала, что «компьютер просто захотел внимания»: два часа вчера прыгал около этой шайтан-машины, диагностируя трабл. Уж чего-чего, а внимания-то уж точно она [машина] получила вдоволь.

carasin ★★★★★
()
9 октября 2011 г.
Ответ на: комментарий от anonymous

Бегло просмотрел, не похоже, там вроде какая-то проблема с диском (RAID). 3 дня назад начал опять искать причину, сейчас делаю биссекцию, ищу коммит между 37-rc6 и 37-rc7, сегодня завтра думаю найду - свободного времени не так много. По результатам отпишусь.

kirichenkoga
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.