LINUX.ORG.RU

Sensors: Как убрать сообщение ERROR: Can't get value of subfeature temp3_min: I/O error?

 ,


0

1

Добрый день. Файл xsession-errors быстро пухнет и набивается одним сообщением «ERROR: Can't get value of subfeature temp3_min: I/O error» от sensors. Вот здесь сказано, что просто «Edit sensors.conf and hide the min and max attributes». В моей системе Linux Mint 21.1 такого файла вообще нет. Есть /etc/sensors3.conf. Я закомментил все строки с temp3, но толку никакого. Команда sensor выдает

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +40.4°C  
Tccd1:        +36.2°C  
Tccd2:        +34.5°C  

nvme-pci-0100
Adapter: PCI adapter
Composite:    +28.9°C  (low  = -20.1°C, high = +83.8°C)
                       (crit = +88.8°C)
ERROR: Can't get value of subfeature temp3_min: I/O error
ERROR: Can't get value of subfeature temp3_max: I/O error
Sensor 2:     +36.9°C  (low  =  +0.0°C, high =  +0.0°C)

nouveau-pci-0700
Adapter: PCI adapter
fan1:           0 RPM
temp1:        +37.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)
Команда sudo sensors-detect выдает в частности
Found `Nuvoton NCT6798D Super IO Sensors' Success!
Но в файле /etc/modules прописывается почему то другой модуль
# Chip drivers
nct6775
В тоже время модули не надены
modprobe 6775
modprobe: FATAL: Module 6775 not found in directory /lib/modules/5.15.0-58-generic
modprobe NCT6792
modprobe: FATAL: Module NCT6792 not found in directory /lib/modules/5.15.0-58-generic 
Хер бы с ней с этой температурой, но как убрать это сообщение? Может надо комментить в каком то другом файле?

★★★★

Последнее исправление: rustamych (всего исправлений: 1)

Я заметил, что файлы /sys/class/nvme/nvme0/hwmon0/temp3_max и /sys/class/nvme/nvme0/hwmon0/temp3_min не читаются

cat: /sys/class/nvme/nvme0/hwmon0/temp3_max: Input/output error
Видимо это и есть причина. Файлы temp1_min и temp1_max читаются и содержат цифры. Пытался тупо скопировать temp1_max в temp3_max, фигушги не дает. Надо где-то отключить опрос temp3-max и temp3_min, но где?

Забыл:

# Board: ASUSTeK COMPUTER INC. ROG STRIX B550-F GAMING WIFI II
# Kernel: 5.15.0-58-generic x86_64
# Processor: AMD Ryzen 9 5950X 16-Core Processor (25/33/2)

rustamych ★★★★
() автор топика
Последнее исправление: rustamych (всего исправлений: 1)

Здравствуйте.

Если сервис lm_sensors не настраивался ранее, то есть смысл запустить sensors-detect, и пройти его в разных вариациях (далее-далее-далее, либо более тщательно).

Бэкап конфига перед этим приветствуется!

NDfan
()
Ответ на: комментарий от rustamych

Да, не совсем правильно понял. Смотрю свою систему: sensors-detect, кроме конфига, информацию о требуемых модулях пересобирает в /etc/sysconfig/lm_sensors. А сервис, при старте, их пытается загрузить.

Проверка пакета показывает, что файл действительны модифицировали.

$ systemctl cat lm_sensors.service 
# /usr/lib/systemd/system/lm_sensors.service
[Unit]
Description=Initialize hardware monitoring sensors

[Service]
EnvironmentFile=/etc/sysconfig/lm_sensors
Type=oneshot
RemainAfterExit=yes
ExecStart=-/usr/libexec/lm_sensors/modprobe $BUS_MODULES $HWMON_MODULES
ExecStart=/usr/bin/sensors -s
ExecStop=-/usr/libexec/lm_sensors/modprobe-r $BUS_MODULES $HWMON_MODULES

[Install]
WantedBy=multi-user.target

$ rpm -V lm_sensors
.......T.  c /etc/sensors3.conf
S.5....T.  c /etc/sysconfig/lm_sensors


$ cat /etc/sysconfig/lm_sensors 
# Generated by sensors-detect on Mon Feb  6 07:21:12 2023
# This file is sourced by /etc/init.d/lm_sensors and defines the modules to
# be loaded/unloaded.
#
# The format of this file is a shell script that simply defines variables:
# HWMON_MODULES for hardware monitoring driver modules, and optionally
# BUS_MODULES for any required bus driver module (for example for I2C or SPI).

HWMON_MODULES="coretemp"

$
$ lsmod | grep temp
coretemp               13444  0 

Честно говоря, он у меня и при пустом файле сам как-то разобрался при следующей перезагрузке, но может модуль самый стоковый был просто.

NDfan
()
Ответ на: комментарий от NDfan

Странно. У меня такого файла нет

cat /etc/sysconfig/lm_sensors
cat: /etc/sysconfig/lm_sensors: Нет такого файла или каталога
У меня даже папки sysconfig нету. Но есть пустая sensors.d

rustamych ★★★★
() автор топика
Ответ на: комментарий от NDfan

Вот еще вывод

cat /etc/systemd/system/multi-user.target.wants/lm-sensors.service
[Unit]
Description=Initialize hardware monitoring sensors

[Service]
Type=oneshot
RemainAfterExit=yes
ExecStart=-/usr/bin/sensors -s
ExecStart=-/usr/bin/sensors

[Install]
WantedBy=multi-user.target
Сильно отличается от вашего.

rustamych ★★★★
() автор топика

Но в файле /etc/modules прописывается почему то другой модуль

Это правильный модуль для этого железа, он там и должен быть.

dmesg | grep -i -A6 'nct'

Возможно, есть смысл добавить тег ryzen.

damix9 ★★★
()
Ответ на: комментарий от damix9

Не помогло. Так и валит в xsession-errors. За день распухает сильно. sensors выдает туже ошибку

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +41.5°C  
Tccd1:        +37.5°C  
Tccd2:        +36.0°C  

nvme-pci-0100
Adapter: PCI adapter
Composite:    +30.9°C  (low  = -20.1°C, high = +83.8°C)
                       (crit = +88.8°C)
ERROR: Can't get value of subfeature temp3_min: I/O error
ERROR: Can't get value of subfeature temp3_max: I/O error
Sensor 2:     +36.9°C  (low  =  +0.0°C, high =  +0.0°C)

nouveau-pci-0700
Adapter: PCI adapter
fan1:        1007 RPM
temp1:        +28.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

А фалы /sys/class/nvme/nvme0/hwmon0/temp3_max и /sys/class/nvme/nvme0/hwmon0/temp3_min так и не читаются.

rustamych ★★★★
() автор топика

По пробуй модуль k10temp деактивировать

  1. Check if k10temp is active. lsmod | grep k10temp
  2. Unload k10temp sudo modprobe -r k10temp
  3. (optional*) blacklist k10temp: sudo bash -c 'sudo echo -e "\n# replaced with zenpower\nblacklist k10temp" >> /etc/modprobe.d/blacklist.conf'

По пробуй добавить опцию acpi_enforce_resources=lax в /etc/default/grub с параметр GRUB_CMDLINE_LINUX_DEFAULT

GRUB_CMDLINE_LINUX_DEFAULT="acpi_enforce_resources=lax quiet splash"

у меня так компе с материнской плате asus rog strix b550-f gaming (wi-fi)

после настроек sensors-detect должно повиться nct6798

nct6798-isa-0290
Adapter: ISA adapter
in0:                      616.00 mV (min =  +0.00 V, max =  +1.74 V)
in1:                      1000.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in2:                        3.38 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in3:                        3.31 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in4:                      1000.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in5:                      864.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in6:                      248.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in7:                        3.38 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in8:                        3.33 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in9:                      904.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in10:                     272.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in11:                       1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in12:                       1.03 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in13:                     360.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in14:                     264.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
fan1:                        0 RPM  (min =    0 RPM)
fan2:                     1948 RPM  (min =    0 RPM)
fan3:                        0 RPM  (min =    0 RPM)
fan4:                        0 RPM  (min =    0 RPM)
fan5:                        0 RPM  (min =    0 RPM)
fan6:                        0 RPM  (min =    0 RPM)
fan7:                        0 RPM  (min =    0 RPM)
SYSTIN:                    +33.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
CPUTIN:                    +32.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
AUXTIN0:                   +86.0°C    sensor = thermistor
AUXTIN1:                   +53.0°C    sensor = thermistor
AUXTIN2:                   -63.0°C    sensor = thermistor
AUXTIN3:                   +80.0°C    sensor = thermistor
PECI Agent 0 Calibration:  +33.5°C  
PCH_CHIP_CPU_MAX_TEMP:      +0.0°C  
PCH_CHIP_TEMP:              +0.0°C  
PCH_CPU_TEMP:               +0.0°C  
TSI0_TEMP:                 +37.8°C  --- это появилось с ядром 5.19.0 раньше небыло
intrusion0:               ALARM
intrusion1:               ALARM
beep_enable:              disabled

я модуль k10temp в blacklist добавил, так как заюзал https://github.com/ocerman/zenpower

zenpower-pci-00c3
Adapter: PCI adapter
SVI2_Core:     1.46 V  
SVI2_SoC:      1.09 V  
Tdie:         +37.9°C  (high = +95.0°C)
Tctl:         +37.9°C  
Tccd1:        +35.2°C  
Tccd2:        +39.5°C  
SVI2_P_Core:  19.20 W  
SVI2_P_SoC:   10.30 W  
SVI2_C_Core:  13.18 A  
SVI2_C_SoC:    9.42 A  

у меня с nvme порядок

nvme-pci-0100
Adapter: PCI adapter
Composite:    +41.9°C  (low  = -60.1°C, high = +89.8°C)
                       (crit = +94.8°C)

nvme-pci-0500
Adapter: PCI adapter
Composite:    +36.9°C  (low  = -273.1°C, high = +84.8°C)
                       (crit = +84.8°C)
Sensor 1:     +36.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +38.9°C  (low  = -273.1°C, high = +65261.8°C)
sap78
()

Есть еще один обход, не рекомендованный, но возможный, собрать модуль.

Это железо вроде бы собирались починить в ядре 5.16, но его пока всё равно в Ubuntu нет. Я еще вот что нашел

https://git.kernel.org/pub/scm/linux/kernel/git/groeck/linux-staging.git/comm...

NDfan

damix9 ★★★
()

там в mint 21.1 через upload manager можно поставить ядро 5.19.0-28-generic, только сначала нужно gcc-12 и g++12 поставить, иначе драйвер карты Nvidia нескомпелируется

apt install gcc-12
apt install g++-12
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-11 11
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-11 11
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-12 12
sudo update-alternatives --config gcc
sudo update-alternatives --config g++
sap78
()
Ответ на: комментарий от sap78
GRUB_CMDLINE_LINUX_DEFAULT="acpi_enforce_resources=lax quiet splash"

Не катит твоя мантра. А зачем модуль k10temp деактивировать? Он же нормально работает. А вот nvme-pci-0100 имеет какой то непонятный sensor-2. Как я понимаю это температура диска nvme. А может как то можно вообще его отключить? Сенсор composite работает же.

rustamych ★★★★
() автор топика
Ответ на: комментарий от damix9

Выводит, что какой конфликт имеется

dmesg | grep -i -A6 'nct67'
[    6.685857] nct6775: Found NCT6798D or compatible chip at 0x2e:0x290
[    6.685862] ACPI Warning: SystemIO range 0x0000000000000295-0x0000000000000296 conflicts with OpRegion 0x0000000000000290-0x0000000000000299 (\AMW0.SHWM) (20210730/utaddress-204)
[    6.685866] ACPI: OSL: Resource conflict; ACPI support missing from driver?
[    6.686303] systemd[1]: Finished Load Kernel Modules.
[    6.686746] systemd[1]: Starting Apply Kernel Variables...
[    6.687097] systemd[1]: Finished Create Static Device Nodes in /dev.
[    6.687859] systemd[1]: Starting Rule-based Manager for Device Events and Files...
И вот еще вывод
cat /sys/class/nvme/nvme0/hwmon0/temp3_max
cat: /sys/class/nvme/nvme0/hwmon0/temp3_max: Ошибка ввода/вывода
Пробовал такую опцию загрузки ядра
GRUB_CMDLINE_LINUX_DEFAULT="acpi_enforce_resources=lax quiet splash"
Никак не помогло.

rustamych ★★★★
() автор топика
Ответ на: комментарий от rustamych

dmesg | grep -i -A6 ‘nct67’

└$► dmesg | grep -i -A6 'nct67'
[    5.784590] nct6775: Using Asus WMI to access 0xc1 chip.
[    5.784625] nct6775: Found NCT6798D or compatible chip at 0x2e:0x290
[    5.785153] systemd[1]: Finished Set the console keyboard layout.
[    5.788494] systemd[1]: Finished Create Static Device Nodes in /dev.
[    5.789735] systemd[1]: Starting Rule-based Manager for Device Events and Files...
[    5.797322] systemd[1]: Started Journal Service.
[    5.800384] systemd-journald[612]: Received client request to flush runtime journal.
[    5.862982] Asymmetric key parser 'pkcs8' registered

я уже не помню как настраивал, но у меня не было проблем с температурой nvme

sap78
()
Ответ на: комментарий от sap78

А откуда это ядро возьмется? Его же нет в убунтовских репозиториях.

Какой из драйверов, 2D, 3D? А чего его компилировать, они же все в бинарных пакетах.

damix9 ★★★
()
Последнее исправление: damix9 (всего исправлений: 1)

вот что у меня подгружается,

lsmod

└$► lsmod
Module                  Size  Used by
exfat                  90112  0
ntfs3                 286720  0
rfcomm                 86016  19
xt_nat                 16384  14
veth                   32768  0
xt_CHECKSUM            16384  1
ipt_REJECT             16384  2
nf_reject_ipv4         16384  1 ipt_REJECT
xt_tcpudp              20480  27
xt_conntrack           16384  5
xt_MASQUERADE          20480  9
nf_conntrack_netlink    53248  0
xfrm_user              45056  1
xfrm_algo              16384  1 xfrm_user
nft_chain_nat          16384  10
nf_nat                 49152  3 xt_nat,nft_chain_nat,xt_MASQUERADE
nf_conntrack          176128  5 xt_conntrack,nf_nat,xt_nat,nf_conntrack_netlink,xt_MASQUERADE
xt_addrtype            16384  2
nft_compat             20480  60
nf_defrag_ipv6         24576  1 nf_conntrack
nf_defrag_ipv4         16384  1 nf_conntrack
br_netfilter           32768  0
nf_tables             278528  438 nft_compat,nft_chain_nat
nfnetlink              20480  4 nft_compat,nf_conntrack_netlink,nf_tables
bridge                327680  1 br_netfilter
stp                    16384  1 bridge
llc                    16384  2 bridge,stp
nvme_fabrics           28672  0
vboxnetadp             28672  0
vboxnetflt             28672  0
vboxdrv               569344  2 vboxnetadp,vboxnetflt
cmac                   16384  3
algif_hash             16384  1
algif_skcipher         16384  1
overlay               163840  0
af_alg                 32768  6 algif_hash,algif_skcipher
bnep                   28672  2
sunrpc                610304  1
binfmt_misc            24576  1
intel_rapl_msr         20480  0
intel_rapl_common      40960  1 intel_rapl_msr
snd_hda_codec_realtek   163840  1
snd_hda_codec_generic   102400  1 snd_hda_codec_realtek
ledtrig_audio          16384  1 snd_hda_codec_generic
snd_hda_intel          53248  3
edac_mce_amd           36864  0
snd_intel_dspcfg       36864  1 snd_hda_intel
snd_intel_sdw_acpi     20480  1 snd_intel_dspcfg
snd_hda_codec         176128  3 snd_hda_codec_generic,snd_hda_intel,snd_hda_codec_realtek
iwlmvm                610304  0
snd_hda_core          118784  4 snd_hda_codec_generic,snd_hda_intel,snd_hda_codec,snd_hda_codec_realtek
btusb                  61440  0
snd_hwdep              20480  1 snd_hda_codec
kvm_amd               167936  0
btrtl                  24576  1 btusb
snd_pcm               159744  3 snd_hda_intel,snd_hda_codec,snd_hda_core
mac80211             1327104  1 iwlmvm
btbcm                  24576  1 btusb
kvm                  1134592  1 kvm_amd
snd_seq_midi           20480  0
btintel                45056  1 btusb
snd_seq_midi_event     16384  1 snd_seq_midi
snd_rawmidi            45056  1 snd_seq_midi
btmtk                  16384  1 btusb
libarc4                16384  1 mac80211
snd_seq                77824  2 snd_seq_midi,snd_seq_midi_event
input_leds             16384  0
joydev                 32768  0
nzxt_smart2            20480  0
bluetooth             827392  54 btrtl,btmtk,btintel,btbcm,bnep,btusb,rfcomm
rapl                   20480  0
iwlwifi               503808  1 iwlmvm
snd_seq_device         16384  3 snd_seq,snd_seq_midi,snd_rawmidi
snd_timer              40960  2 snd_seq,snd_pcm
ecdh_generic           16384  2 bluetooth
nls_iso8859_1          16384  1
ecc                    40960  1 ecdh_generic
snd                   114688  16 snd_hda_codec_generic,snd_seq,snd_seq_device,snd_hwdep,snd_hda_intel,snd_hda_codec,snd_hda_codec_realtek,snd_timer,snd_pcm,snd_rawmidi
cfg80211             1040384  3 iwlmvm,iwlwifi,mac80211
eeepc_wmi              16384  0
wmi_bmof               16384  0
zenpower               16384  0
soundcore              16384  1 snd
ccp                   110592  1 kvm_amd
nvidia_uvm           1236992  0
mac_hid                16384  0
sch_fq_codel           24576  5
pkcs8_key_parser       16384  0
nct6775                28672  0
nct6775_core           94208  1 nct6775
hwmon_vid              16384  1 nct6775
msr                    16384  0
parport_pc             53248  0
ppdev                  24576  0
lp                     28672  0
parport                73728  3 parport_pc,lp,ppdev
ramoops                28672  0
reed_solomon           28672  1 ramoops
pstore_blk             16384  0
pstore_zone            32768  1 pstore_blk
efi_pstore             20480  0
ip_tables              32768  0
x_tables               57344  9 xt_conntrack,nft_compat,xt_tcpudp,xt_addrtype,xt_CHECKSUM,xt_nat,ipt_REJECT,ip_tables,xt_MASQUERADE
autofs4                45056  2
btrfs                1638400  5
blake2b_generic        20480  0
raid10                 65536  0
raid456               163840  0
async_raid6_recov      24576  1 raid456
async_memcpy           20480  2 raid456,async_raid6_recov
async_pq               24576  2 raid456,async_raid6_recov
async_xor              20480  3 async_pq,raid456,async_raid6_recov
async_tx               20480  5 async_pq,async_memcpy,async_xor,raid456,async_raid6_recov
xor                    24576  2 async_xor,btrfs
raid6_pq              122880  4 async_pq,btrfs,raid456,async_raid6_recov
libcrc32c              16384  5 nf_conntrack,nf_nat,btrfs,nf_tables,raid456
raid1                  49152  0
raid0                  24576  0
multipath              20480  0
linear                 20480  0
dm_mirror              24576  0
dm_region_hash         24576  1 dm_mirror
dm_log                 20480  2 dm_region_hash,dm_mirror
nvidia_drm             69632  12
nvidia_modeset       1200128  18 nvidia_drm
nvidia              35495936  882 nvidia_uvm,nvidia_modeset
drm_kms_helper        200704  1 nvidia_drm
mfd_aaeon              16384  0
asus_wmi               57344  2 eeepc_wmi,mfd_aaeon
syscopyarea            16384  1 drm_kms_helper
sysfillrect            20480  1 drm_kms_helper
sparse_keymap          16384  1 asus_wmi
sysimgblt              20480  1 drm_kms_helper
uas                    28672  0
video                  61440  1 asus_wmi
fb_sys_fops            16384  1 drm_kms_helper
hid_generic            16384  0
usb_storage            77824  4 uas
usbhid                 65536  0
hid                   159744  3 nzxt_smart2,usbhid,hid_generic
crct10dif_pclmul       16384  1
crc32_pclmul           16384  0
ghash_clmulni_intel    16384  0
aesni_intel           376832  4
nvme                   49152  4
crypto_simd            16384  1 aesni_intel
platform_profile       16384  1 asus_wmi
cryptd                 24576  3 crypto_simd,ghash_clmulni_intel
drm                   581632  16 drm_kms_helper,nvidia,nvidia_drm
igc                   159744  0
i2c_piix4              28672  0
nvme_core             147456  7 nvme,nvme_fabrics
ahci                   49152  2
xhci_pci               24576  0
libahci                49152  1 ahci
xhci_pci_renesas       20480  1 xhci_pci
wmi                    32768  4 nct6775,asus_wmi,wmi_bmof,mfd_aaeon
gpio_amdpt             20480  0
sap78
()
Ответ на: комментарий от rustamych

да они просто уставливают компилятор С++ и С нужной версии, в принципе если версия С++ старше, то ничего не должно сломаться. ну край, если что можно обратно версию 11 поставить командами:

sudo update-alternatives --config gcc
sudo update-alternatives --config g++

Ломает обычно python и его библиотеки, поэтому ставлю для своих проектов miniconda

sap78
()
Последнее исправление: sap78 (всего исправлений: 1)
Ответ на: комментарий от rustamych

Можно через программу mainline жахнуть(поставить) 6.1.9 правда нужен gcc11 опять же для Nvidia, я поставил на ASUS B550, a там какие-то firmware ошибки в dmesg, так вроде ядро рабочее, думаю по свежее нужны firmware для ASUS B550, а старому буку ASUS-G750JS так во общее зашло ядрешко 6.1.9, там наконец появилось GPUfan, какие-то особенности дискретной карты Nvidia GTX 870M на буке не выводит GPUfan, а я много версий драйверов NVIDIA перепробовал.

asus-isa-0000
Adapter: ISA adapter
cpu_fan:     2300 RPM
gpu_fan:     2000 RPM
temp1:        +41.0°C
sap78
()
Последнее исправление: sap78 (всего исправлений: 3)
Ответ на: комментарий от sap78

ТС, после sudo update-grub перезагрузиться надо. Достаточно накидали обходов. Остальные выводы команд желательны, но предположительно это упомянутый баг. Рано или поздно в Ubuntu его исправят.

damix9 ★★★
()
Ответ на: комментарий от damix9

sap78 После апгрейты граба появился драйвер nct6798-isa-0290, но ошибка осталась. Она связана с другим драйвером nvme-pci-0100.

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +44.5°C  
Tccd1:        +33.8°C  
Tccd2:        +32.8°C  

nvme-pci-0100
Adapter: PCI adapter
Composite:    +25.9°C  (low  = -20.1°C, high = +83.8°C)
                       (crit = +88.8°C)
ERROR: Can't get value of subfeature temp3_min: I/O error
ERROR: Can't get value of subfeature temp3_max: I/O error
Sensor 2:     +36.9°C  (low  =  +0.0°C, high =  +0.0°C)

nct6798-isa-0290
Adapter: ISA adapter
in0:                      136.00 mV (min =  +0.00 V, max =  +1.74 V)
in1:                        1.01 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in2:                        3.41 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in3:                        3.28 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in4:                        1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in5:                      976.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in6:                      232.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in7:                        3.41 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in8:                        3.34 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in9:                      912.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in10:                     392.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in11:                       1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in12:                       1.03 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in13:                     320.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in14:                     232.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
fan1:                        0 RPM  (min =    0 RPM)
fan2:                      605 RPM  (min =    0 RPM)
fan3:                        0 RPM  (min =    0 RPM)
fan4:                        0 RPM  (min =    0 RPM)
fan5:                        0 RPM  (min =    0 RPM)
fan6:                        0 RPM  (min =    0 RPM)
fan7:                      609 RPM  (min =    0 RPM)
SYSTIN:                    +27.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
CPUTIN:                    +34.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
AUXTIN0:                   +90.5°C    sensor = thermistor
AUXTIN1:                   +37.0°C    sensor = thermistor
AUXTIN2:                   -60.0°C    sensor = thermistor
AUXTIN3:                   +82.0°C    sensor = thermistor
PECI Agent 0 Calibration:  +34.0°C  
PCH_CHIP_CPU_MAX_TEMP:      +0.0°C  
PCH_CHIP_TEMP:              +0.0°C  
PCH_CPU_TEMP:               +0.0°C  
intrusion0:               ALARM
intrusion1:               ALARM
beep_enable:              disabled

nouveau-pci-0700
Adapter: PCI adapter
fan1:         567 RPM
temp1:        +25.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

rustamych ★★★★
() автор топика
Ответ на: комментарий от damix9

Тут все нормально (после апгрейта граба)

cat /proc/cmdline
BOOT_IMAGE=/boot/vmlinuz-5.15.0-58-generic root=UUID=bb822702-d3a7-486b-9bf4-0e824892551c ro acpi_enforce_resources=lax quiet splash
Попробую отключить k10temp. А если что, то как его возвернуть?

rustamych ★★★★
() автор топика
Ответ на: комментарий от sap78

Мне температура nvme вообще не нужна. Так мб можно просто оключить драйвер nvme-pci-0100, который и выдает ошибки?

lsmod | grep k10temp
k10temp                16384  0
lsmod | grep nvme
nvme                   49152  4
nvme_core             135168  6 nvme
Если сделать sudo modprobe -r nvme, то ничего не сломается?

rustamych ★★★★
() автор топика
Ответ на: комментарий от rustamych

думаю сломает, пишут что ошибка с самом lm-sensors по пробуй добавить файл hamonikr, можно другое имя файла, проигнорировать температуру датчика temp3 устройства nvme-pci-0100

sudo vi /etc/sensor.d/hamonikr

chip "nvme-pci-0100"
       ignore temp3

потом перезапусти

sudo service lm-sensors restart

А что за nvme установлен? аж 3 сенсора температуры? в моем Samsung SSD 970 EVO всего 2 датчика температуры, а в XPG GAMMIX S50 вообще один.

у меня установлены dpkg -l |grep sensors

└$► dpkg -l |grep sensors
ii  iio-sensor-proxy                              3.3-0ubuntu6                                         amd64        
ii  libqt5sensors5:amd64                          5.15.3-1                                             amd64        
ii  libsensors-config                             1:3.6.0-7ubuntu1                                     all          
ii  libsensors5:amd64                             1:3.6.0-7ubuntu1                                     amd64        
ii  libsensors5:i386                              1:3.6.0-7ubuntu1                                     i386         
ii  lm-sensors                                    1:3.6.0-7ubuntu1                                     amd64       
ii  xsensors                                      0.70-5build1                                         amd64      

xsensors, libqt5sensors5 – просто графический sensors

Папка /etc/sensors.d/ пустая

└$► ls -al /etc/sensors.d/
total 0
drwxr-xr-x 1 root root   24 авг  8  2022 .
drwxr-xr-x 1 root root 5630 фев  5 10:54 ..
-rw-r--r-- 1 root root    0 ноя  7  2019 .placeholde

в файле ls -al /etc/sensors3.conf ничего не менял

└$► ls -al /etc/sensors3.conf 
-rw-r--r-- 1 root root 10593 ноя  7  2019 /etc/sensors3.conf
┌[ andrew@asus-b550:/etc 10:13:56 ]
└$► sha256sum ./sensors3.conf 
f82617246796b8a05e19980f4c31205f2fb8fb1804afbf0d1a6af4e487baf115  ./sensors3.conf
┌[ andrew@asus-b550:/etc 10:13:59 ]
└$► apt-file search /etc/sensors3.conf 
libsensors-config: /etc/sensors3.conf 
└$► cat /etc/modules 
# /etc/modules: kernel modules to load at boot time.
#
# This file contains the names of kernel modules that should be loaded
# at boot time, one per line. Lines beginning with "#" are ignored.

# Chip drivers
nct6775

переустанови конфиги если правил /etc/sensors3.conf

sudo apt purge libsensors-config
sudo apt install libsensors-config

пишут что с ядра Kernel 5.16 можно не включать параметр acpi_enforce_resources=lax

sap78
()
Последнее исправление: sap78 (всего исправлений: 6)
Ответ на: комментарий от rustamych

Fan2: 605 RPM – это кулер CPU, AUXTIN1: +37.0°C – это температура чипа B550, южного моста, если второго nvme нет, то он вообще холодный, можно поставить графическую программу psensor:

apt install psensor

в программе есть настройки alarm по температуре, и ШИМ- вентиляторов, можно настроить чтобы приходило оповещение, когда nvme,nvidia - нагреваются или когда кулер fan7 остановился, упали обороты до 500PRM

sap78
()
Последнее исправление: sap78 (всего исправлений: 7)

Если есть желание можно поставить OpenRGB и поиграть с LEDs на материнской плате, Я пробовал разгонят CPU, там через биос, увеличивал лимиты, включил авторазгон от ASUS, в принципе особого разгона не достиг, все выжимает производитель ASUS c их авторазгон. Потом вообще выключил авто разгон от ASUS в биос, так как zenmonitor показывал пики 1.56V на AMD Ryzen 9 3900XT в покое, это он так бустился, пока я не работаю, а он пьет энергетик, с..а, а под нагрузкой пиков напряжения 1.56V нет, так как проц не бустится, а работает как шахтер, во общем я выключил авторазгон, не стал насиловать проц энергетиком, стало напряжение max 1.52V в пиках.

sap78
()
Последнее исправление: sap78 (всего исправлений: 4)
Ответ на: комментарий от sap78

Conda лучше выключить по умолчанию, чтобы ничего не поломала

conda config --set auto_activate_base false

и потом можно делать проекты в своем окружение

conda create --name GFPGAN python=3.7

И больше ничего не ломается хоть python 2.7 ставь

└$► conda env list
# conda environments:
#
base                     /home/andrew/miniconda3
GFPGAN                   /home/andrew/miniconda3/envs/GFPGAN
Instagram_Scraper        /home/andrew/miniconda3/envs/Instagram_Scraper
PythonForProgrammers     /home/andrew/miniconda3/envs/PythonForProgrammers
kubespray                /home/andrew/miniconda3/envs/kubespray
py27                     /home/andrew/miniconda3/envs/py27

можно также сделать через виртуальное окружение, но мне лень

sap78
()
Последнее исправление: sap78 (всего исправлений: 3)
Ответ на: комментарий от sap78

Ура! Спасибо большое, идея с файлом hamonikr сработала. Сообщения исчезли. «А что за nvme установлен? аж 3 сенсора температуры?» сам не понимаю, что за nvme. Комп новый, неделю назад собрали.

sensors
nct6798-isa-0290
Adapter: ISA adapter
in0:                      568.00 mV (min =  +0.00 V, max =  +1.74 V)
in1:                        1.01 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in2:                        3.41 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in3:                        3.28 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in4:                        1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in5:                      928.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in6:                      272.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in7:                        3.41 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in8:                        3.34 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in9:                      912.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in10:                     376.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in11:                       1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in12:                       1.03 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in13:                     392.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in14:                     288.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
fan1:                        0 RPM  (min =    0 RPM)
fan2:                      582 RPM  (min =    0 RPM)
fan3:                        0 RPM  (min =    0 RPM)
fan4:                        0 RPM  (min =    0 RPM)
fan5:                        0 RPM  (min =    0 RPM)
fan6:                        0 RPM  (min =    0 RPM)
fan7:                      583 RPM  (min =    0 RPM)
SYSTIN:                    +30.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
CPUTIN:                    +35.0°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
AUXTIN0:                   +83.5°C    sensor = thermistor
AUXTIN1:                   +40.0°C    sensor = thermistor
AUXTIN2:                   -60.0°C    sensor = thermistor
AUXTIN3:                   +78.0°C    sensor = thermistor
PECI Agent 0 Calibration:  +35.0°C  
PCH_CHIP_CPU_MAX_TEMP:      +0.0°C  
PCH_CHIP_TEMP:              +0.0°C  
PCH_CPU_TEMP:               +0.0°C  
intrusion0:               ALARM
intrusion1:               ALARM
beep_enable:              disabled

nvme-pci-0100
Adapter: PCI adapter
Composite:    +27.9°C  (low  = -20.1°C, high = +83.8°C)
                       (crit = +88.8°C)

k10temp-pci-00c3
Adapter: PCI adapter
Tctl:         +38.9°C  
Tccd1:        +36.2°C  
Tccd2:        +33.8°C  

nouveau-pci-0700
Adapter: PCI adapter
fan1:        1483 RPM
temp1:        +25.0°C  (high = +95.0°C, hyst =  +3.0°C)
                       (crit = +105.0°C, hyst =  +5.0°C)
                       (emerg = +135.0°C, hyst =  +5.0°C)

rustamych ★★★★
() автор топика
Ответ на: комментарий от sap78

Знаю такую прогу, установлена. Про оповещения не знал, настрою. Еще есть неплохая прога xsensors. Удобная. Для мониторинга загрузки ядер использую xosview, настроил только на cpu. Для сложных задач, когда все ядра задействованы.

rustamych ★★★★
() автор топика
Ответ на: комментарий от damix9
inxi -D
Drives:
  Local Storage: total: 4.57 TiB used: 185.12 GiB (4.0%)
  ID-1: /dev/nvme0n1 vendor: Kingston model: SKC3000S1024G size: 953.87 GiB
  ID-2: /dev/sda vendor: Seagate model: ST2000DM008-2UB102 size: 1.82 TiB
  ID-3: /dev/sdb vendor: Seagate model: ST2000DM008-2UB102 size: 1.82 TiB
rustamych ★★★★
() автор топика
Ответ на: комментарий от rustamych

sudo smartctl -a /dev/nvme0

ключ -a выводить все параметры

$► sudo smartctl -a /dev/nvme0

...      
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        31 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    16 471 624 [8,43 TB]
Data Units Written:                 33 530 439 [17,1 TB]
Host Read Commands:                 355 168 155
Host Write Commands:                654 081 647
Controller Busy Time:               1 177
Power Cycles:                       1 553
Power On Hours:                     1 533
Unsafe Shutdowns:                   101
Media and Data Integrity Errors:    0
Error Information Log Entries:      2 126
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               31 Celsius
Temperature Sensor 2:               38 Celsius
...

sap78
()
Ответ на: комментарий от rustamych

народ пишет скорость записи не очень Kingston KC3000 https://c.dns-shop.ru/thumb/st1/fit/0/0/84662b0d1c6cca904aa051f16968066d/647f5194bc1af8a392381796e1e13f234e3a04fa641500477fe1804e33a69809.png.webp

скорей всего буфер заполнился и скорость записи упала

sap78
()
Последнее исправление: sap78 (всего исправлений: 2)
Ответ на: комментарий от rustamych

такая же хрень, можно просто поставить драйвер версии 390 или отключить службу nvidia

Disable NVIDIA systemd services

sudo systemctl stop nvidia-suspend.service
sudo systemctl stop nvidia-hibernate.service
sudo systemctl stop nvidia-resume.service

sudo systemctl disable nvidia-suspend.service
sudo systemctl disable nvidia-hibernate.service
sudo systemctl disable nvidia-resume.service

    Remove NVIDIA systemd script

sudo rm /lib/systemd/system-sleep/nvidia

Reboot and you should be able to suspend and resume properly with driver version 470.xx.

Подробнее тут

sap78
()
Ответ на: комментарий от sap78

Я тоже вначале думал поставить старую версию, но плюнул. Меня вполне устраивает и свободный драйвер. Скоро куплю второй монитор, вот там посмотрим что за проблемы возникнут.

rustamych ★★★★
() автор топика
Ответ на: комментарий от rustamych

пакеты smartmontools и можно ещё nvme-cli

└$► whereis smartctl
smartctl: /usr/sbin/smartctl /usr/share/man/man8/smartctl.8.gz
┌[ andrew@asus-b550:~ 21:13:18 ]
└$► whereis nvme
nvme: /usr/sbin/nvme /etc/nvme /usr/share/man/man1/nvme.1.gz
┌[ andrew@asus-b550:~ 21:13:24 ]
└$► apt-file search /usr/sbin/smartctl
smartmontools: /usr/sbin/smartctl         
┌[ andrew@asus-b550:~ 21:13:40 ]
└$► apt-file search /usr/sbin/nvme
nvme-cli: /usr/sbin/nvme   

nvme smart-log /dev/nvme0 – почти тоже самое smartctl

sap78
()