LINUX.ORG.RU

Постоянно моргает hdd led на корпусе в iotop тишина.

 , ,


0

1

Такая вот странная ситуация. Поставил новую мамку и обратил внимание, что постоянно моргает индикатор жесткого диска на передней панели корпуса, причем с постоянной частотой - два раза в секунду, кратковременно. При этом iotop активности особой не показывает, jbd2 время от времени пишет и все.
В системе два одинаковых ssd (samsung 970 pro 512gb), один на мамке, другой на переходнике в pci-e 16х.
Тот, что на мамке - под систему отведен. Причем, обратил внимание, что греется несколько сильнее, и временами разогревается при отсутствии сильного трафика градусов до 75 (контроллер, память - 55). По тому, что в переходнике - светодиоды на переходнике моргают с той же частотой, что и hdd-led на корпусе! Что бы это могло быть, куда копнуть? Вроде на старой мамке таких экзерцисов не наблюдал.
Мамка giabyte a520mk v2 rev1.1, биос последний обновлен, проц Ryzen 4650Pro, видюха встроенная. В биосе настройки дефолтные + включена поддержка виртуализации. Стоковый Debian12+KDE.


Ответ на: комментарий от firkax

В биосе не дергает, в меню граба - тоже, даже более того - не дергает на этапе логина в КДЕ, чисто прогружаются службы и все - тишина. Зато стоит залогиниться и всё - пошло-поехало.

sptim
() автор топика
Ответ на: комментарий от Dimez

Замечу, что лишь временами. Греется системный, что на M2 мамки. А моргают светодиоды на том, что в переходнике на pci-e слоте (но не знаю, это отображение обращений именно к нему, или просто индикация обращений к дискам вообще, может быть такое?).

sptim
() автор топика
Ответ на: комментарий от sptim

Создай нового юзера, залогинься в него и сравни.

И ещё способ: смотришь список процессов юзера, ставишь всем kill -STOP (переключившись на другую консоль рута например т.к. юзерская зависнет после этого), проверяешь что диск перестал дёргаться, потом включаешь их по одному (kill -CONT) и смотришь когда начнётся.

firkax ★★★★★
()
Ответ на: комментарий от u5er

Ну не два раза в секунду ж, это вообще за гранью добра и зла. Больше на монитор температуры похоже, но у меня вроде виджетов таких не стоит, если только сервис какой... но я вроде не ставил ничего нового, а раньше не моргал, потому и удивился.

sptim
() автор топика
Ответ на: комментарий от firkax

Вот с этим соглашусь. А вопрос такой, чтение температуры же - это тоже блочная операция на устройство? Т.е. она тоже должна попадать в статистику, даже если обращается к контроллеру, а не читает/пишет на диск или это уже другой коленкор?

sptim
() автор топика
Ответ на: комментарий от u5er

Вообще, тут логика прямая. Контроллер диска зажигает светодиод в тот момент, когда идёт обмен информацией с диском. Выполнение команды - это тоже обмен информацией. Можешь легко проверить. Загрузи модуль drivetemp, найды в /sys/class/hwmon показометр температуры дисков и дёргай cat’ом её. Индикатор будет мигать в момент дёрганья.

u5er ★★
()
Ответ на: комментарий от anonymous

Такая же ситуация. Я бы предположил, что это какая-нибудь служба сенсоров считывает состояние дисков для реал-тайм отображения... Тайминг подходящий... Блин, ни виджетов, ни служб никаких не ставил, в обновках тоже ничего такого не прилетало.
Я блин уже и кеш ФФ на темпфс переделал (это я про нагрев диска, думал может он нагружает), но нет.

sptim
() автор топика
Ответ на: комментарий от anonymous

Ну это контроллер, он всегда горячее. Если что, то температура, что отображается в винде например - это как раз температура памяти, и когда говорят о температуре SSD - как раз ее приводят. :)
Но согласен, без жесткой нагрузки такого быть по идее не должно (ну или контроллер если не занимается в простое какой-то своей внутренней самодеятельностью - оптимизирует карту блоков например?).

sptim
() автор топика
Ответ на: комментарий от sptim

Так, вроде бы нашел, что это было. Но хоть убей не понимаю как так. Добавил виджет системного монитора на панель, добавил туда температуру с датчиков SSD - «мигает без изменений», удалил виджет с панели - «мигает», завершил сеанс - «погас», залогинился... и тишина! Вот это блин пердюмонокль! 8-x

p.s. Всем большое спасибо за советы! :)

sptim
() автор топика
Ответ на: комментарий от vel

Ну, это еще по божески - раз в пять минут (но не уснуть, да), у меня jbd2 постоянно что-то в разделы ext4 пишет раз в несколько секунд - журналирование, тут без вариантов, если только извращениями не заниматься. За совет тулзы - отдельное спасибо! Очень подробный вывод - для анализа самое то.

sptim
() автор топика
Последнее исправление: sptim (всего исправлений: 2)
Ответ на: комментарий от firkax

Я выше написал, как избавился от этого, да, включаю виджет «системный монитор» с добавлением датчиков температуры SSD - и начинает дергать. Фокус в том, что у меня данный виджет не использовался, но после его включения-отключения - всё стало по феншую, х.з. что это был за затык такой, боюсь, уже и не узнать.

sptim
() автор топика
Ответ на: комментарий от sptim

Ну это контроллер, он всегда горячее. Если что, то температура, что отображается в винде например - это как раз температура памяти, и когда говорят о температуре SSD - как раз ее приводят. :)

У меня 2 SSD, посмотрел sensors, на одном 37С, на другом 40С. 75 в простое это и правда ад какой-то.

Loki13 ★★★★★
()
Ответ на: комментарий от Loki13

Х.з. я не нашел что у него там за внутренняя жизнь. :(
Вот, сейчас дернул sensors - опять горячий, хотя ничего не делаю, к диску обращений нет...

nvme-pci-0500
Adapter: PCI adapter
Composite:    +46.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +46.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +72.8°C  (low  = -273.1°C, high = +65261.8°C)

nvme-pci-0100
Adapter: PCI adapter
Composite:    +34.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +34.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +39.9°C  (low  = -273.1°C, high = +65261.8°C)

p.s.
А пока дописал и снова дернул - уже холодный:
nvme-pci-0500
Adapter: PCI adapter
Composite:    +42.9°C  (low  = -273.1°C, high = +80.8°C)
                       (crit = +80.8°C)
Sensor 1:     +42.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +49.9°C  (low  = -273.1°C, high = +65261.8°C)

sptim
() автор топика
Последнее исправление: sptim (всего исправлений: 2)
Ответ на: комментарий от fucpsy

А его можно как-то неправильно подключить? :)

Переходник моргает судя по всему, а не диск.

На нем дубляж hdd-led, это были обращения чтения температуры диска, потому и не было ничего в iotop.

sptim
() автор топика
Ответ на: комментарий от firkax

iotop кривое всё, может чего-то не видеть

ну да, оно может не показать обращения к диску, которые были между опросами iotop'а. что есть под linux, что вообще всё показывает что обращалось к диску?

teod0r ★★★★★
()

Эта тема поднималась уже много раз. Начиная с какой-то 5.x версии ядра в драйвер дисковой подсистемы был добавлен heartbeat. Т.е. лампочка мигает, даже если IO нет. Да, именно 1 раз за 2 сек. Независимо от железа.

anonymous
()
Ответ на: комментарий от anonymous

Тут не раз в две секунды было, а два раза в секунду.
Но интересно стало и на всякий случай глянул: CONFIG_LEDS_TRIGGER_HEARTBEAT=m, насколько понимаю сборка в модуль?
В загруженных модулях триггеров нет.

sptim
() автор топика
Ответ на: комментарий от sptim

Да, бросьте, ничего интересного.

К heartbeat-у/watchdog-у для компьтера это не имеет отношения. Например, в Armbian для SBC мигает 3-й светодиод как показатель работы с software watchdog, но никак не светодиоды hdd или «копьютер включен».

По большому счёту эта «фича» всем только навредила. Люди начинают искать, в чём проблема с ПО и/или дисками, хотя проблемы нет совсем.

Чаще всего зависания дисковой подсистемы бывают из-за забитости буферов при копировании, когда целевое устройстово вдруг потерялось.

В этом случае, могут залочится и другие дисковые устройства, вплоть до невозможности воспользоваться терминалом: не будут работать самые базовые команды, т.к. «/» недоступен. Админ сразу понимает в чём дело. На лампочку тут смотреть бессмысленно, она может продолжать мигать.

Эта фича в Linux по своей бессмысленности и вреду очень похожа на добавление Wait_IO в показатель LA в 90-х гг. Админитраторы классических Unix в курсах.

А дисковую активность удобно смотреть atop (от root-а). Эта тулза показывает в том числе и scrub для зеркал md / zfs. Ну, и обычные iostat -d 10, zpool iostat -vyl 10.

anonymous
()