Суть проблемы: система иногда зависает. Причем намертво, так, что ни пинги, ни alt-sysreq уже не работают. Если система во время зависания издавала какой-либо звук — он также повиснет, превратившись в однотонный сигнал (т.е. звуковуха не воспроизводит по циклическому буферу — где встало, тот сигнал и останется на выходе). Более того — reset и тот не работает: при нажатии на резет секунд 10 ничего не происходит, потом комп полностью выключается, и секунд через 5 включается обратно. Если же нажать резет когда все работает — система моментально уходит в ребут.
Зависания происходят непредсказуемо, обычно при перемотке видео, но иногда и просто на ровном месте. Нагрузки у системы во время зависаний обычно нет. Частота возникновения — примерно раз-два в сутки. В логах, само собой, все чисто.
Система: debian sid, ядро дистрибутивное 3.0.0-1-amd64 (но проявлялось и на более ранних, как минимум с .38, возможно и еще раньше).
Железо:
CPU: Intel(R) Core(TM) i7 CPU 860 @ 2.80GHz (4 ядра с HT, итого 8 логических);
RAM: 10Gb (проблема проявляется и если уменьшить до 4);
GPU: GeForce GT 240 на нвидиевском блобе версии 280.11 (на более ранние версиях, как минимум начиная с 197.*, проблема также проявляется).
lspci: http://pastebin.com/LKZhLjQ2
Что смог обнаружить:
* при попытке импортировать медиатеку в ~16к треков в rhythmbox, где-то 95% что зависание произойдет. Медиатека на NFS шаре, так что i/o операций с диском тут практически нет. Замена NFSv4 на NFSv3 или на SSHFS ничего не меняет — все равно виснет. Отключение композитинга и закрытие окна программы во время добавления не помогает, т.е. проблема очевидно не в видео;
* k3b гарантированно вис при запуске. Решилось параметром ядра libata.dma=1, но это ничуть не повлияло на описываемые зависоны;
* на liquorix ядрах аналогичного вида зависание происходило при инициализации видеосистемы при загрузке X-ов. Вылечилось через intel_iommu=off, но опять же это нисколько не помогает с описываемым;
* переключение IRQ на одно ядро ничуть не помогает;
* clocksource=hpet не помогает;
* memtest86+ никаких ошибок не выявляет;
* отключение свопа не помогает;
* cpu-интенсивные операции (cpuburn, кодирование видео, компиляция и т.п.) зависонов не вызывают, даже в случае если все ядра длительно загружены на 100%.
Предположительно это проблема с железом, но локализовать не могу. Разве что новую мать покупать, что как-то не хочется т.к. нет никакой гарантии что проблема в ней.
Что можете порекомендовать попробовать для локализации/исправления проблемы?