Столкнулся с одним вялотекущим багом в Linux ядре, известным ещё с ядер 2.6, но до сих пор, как оказывается, не исправленным.
Есть хост-система с Xen, под ней работает N гостей (несколько PV и одна HVM). Некоторые машины (только PV) при условии использовании более одного ядра (vcpus) и некоторой интенсивной нагрузке (предполагаю, что прежде всего по части дискового или сетевого I/O) со временем впадают в ступор - не зависают совсем, но где-то около. После появления сообщения «BUG: soft lockup - CPU#* stuck for ***s!», впринципе, машину уже приходится жёстко перезагружать, поскольку она перестаёт отзываться.
Детальный лог http://pastebin.com/SXiFHnj4
Debian Wheezy. Ядро 3.2.51-1 x86_64 и на хосте, и под гостем.
Другие обсуждения по теме:
[Xen-devel] on starting HVM-domU whole system freezes with «soft lockup - CPU X stuck for XXs! [qemu-dm:...]»
Debian Bug report logs - #638172 / BUG: soft lockup - CPU#0 stuck for 61s!