У меня был вопрос по поводу производительности NVME SSD на Debian 11 (последние обновления установлены).
Производительность NVME SSD на линуксе
Я включил тот самый NVME SSD в mdadm RAID 1 массив с жестким диском (диск в режиме write-mostly), рассчитывая получить скорость NVME SSD на чтение вместе с надежностью RAID-массива. На основном RAID-разделе была смонтирована корневая директория («/»), раздел зашифрован через LUKS cryptsetup. Есть еще незашифрованный /boot, тоже в RAID 1.
И тут начался ад. Система начала произвольно лагать во время работы и отжирать процессор. А самое ужасное, что загрузка системы начала лагать и останавливаться на неопределенное время каждый раз на разных этапах. Решилась проблема только отключением RAID-зеркала раздела «/» на NVME SSD, после чего вернулась стабильность работы (пусть и со скоростью жесткого диска).
Напомнило ситуацию, когда я сидел на старом ПК с Windows XP на аппаратном RAID 0 и система тоже адски лагала с DPC Latency, что было видно на DPC Latency Checker:
https://www.exedb.com/software/DPC Latency Checker
Тогда проблема решилась только отказом от аппаратного RAID 0.
Есть ли способы заставить NVME SSD нормально работать на линуксе? С чего начать диагностику?
Для «особо одаренных», не знающих зачем увязывать ssd и hdd в один raid1:
https://superuser.com/questions/293144/combining-ssd-and-hard-disk-in-softwar...
Обновление. Проблема пока что частично решилась отключением APST через опцию командной строки ядра
nvme_core.default_ps_max_latency_us=0
Похоже, проблема была в кривой реализации APST то ли ядра, то ли в самом железе.
Теперь система грузится и работает в основном без проблем. Но иногда бывает (уже 2 раза за 2 недели случалось), что NVME SSD «отваливается» во время работы и система не видит его как диск аж до перезагрузки. Хотя в lspci NVME SSD по-прежнему видно. Что это может быть?