KVM зависает в зомби
Вводные: CentOS 7.1 с KVM Гостевая машина Ubuntu 14.04.2 На гостевой запускается stress -c 4 -d 4, что нагружает систему. Через некоторое время (часов через 12 или более) начинают появляться за записи в log/messages
Jun 18 07:11:49 srv-test1 kernel: INFO: task qemu-kvm:23633 blocked for more than 120 seconds.
Jun 18 07:11:49 srv-test1 kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables this message.
Jun 18 07:11:49 srv-test1 kernel: qemu-kvm D ffff88041e293680 0 23633 1 0x00000080
Jun 18 07:11:49 srv-test1 kernel: ffff8800d1d47d70 0000000000000082 ffff8800d1d47fd8 0000000000013680
Jun 18 07:11:49 srv-test1 kernel: ffff8800d1d47fd8 0000000000013680 ffff8803d6a738e0 ffff88041e293f48
Jun 18 07:11:49 srv-test1 kernel: ffff8803d6a738e0 7fffffffffffffff ffff8803d6a738e0 0000000000000017
Jun 18 07:11:49 srv-test1 kernel: Call Trace:
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff8160a1d9>] schedule+0x29/0x70
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff81608119>] schedule_timeout+0x209/0x2d0
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff812ab153>] ? __blk_run_queue+0x33/0x40
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff8101b589>] ? read_tsc+0x9/0x10
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff810c8e5c>] ? ktime_get_ts+0x4c/0xf0
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff816099ab>] io_schedule_timeout+0x9b/0xf0
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff8160a9d6>] wait_for_completion_io+0x116/0x170
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff810a9650>] ? wake_up_state+0x20/0x20
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff812b0b84>] blkdev_issue_flush+0xb4/0x110
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff81200635>] blkdev_fsync+0x35/0x50
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff811f7215>] do_fsync+0x65/0xa0
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff811f7503>] SyS_fdatasync+0x13/0x20
Jun 18 07:11:49 srv-test1 kernel: [<ffffffff81614de9>] system_call_fastpath+0x16/0x1b
ошибка: Не удалось разрушить домен test_ubn
ошибка: Не удалось прервать выполнение процесса 22090 с SIGKILL: Устройство или ресурс занято
Замечу, что если не делать virsh destroy, то гостевая машина отвечает и вполне успешно работает.
На практике, данная ситуация случается не часто, когда сервер нагружается под 85-100% CPU с наличием запущенного резервного копирования, или другой нагрузкой на диск.
Возможно кто-то сталкивался с такой ситуацией