LINUX.ORG.RU

Ошибка ввода/вывода

 ,


0

2

Около года использовал Manjaro и не знал проблем


 ██████████████████  ████████     enotke@enotke-ms7a38
 ██████████████████  ████████     OS: Manjaro 23.1.0 Vulcan
 ██████████████████  ████████     Kernel: x86_64 Linux 6.5.9-1-MANJARO
 ██████████████████  ████████     Uptime: 11m
 ████████            ████████     Packages: 1258
 ████████  ████████  ████████     Shell: bash
 ████████  ████████  ████████     Resolution: 5360x1440
 ████████  ████████  ████████     DE: Xfce4
 ████████  ████████  ████████     WM: Xfwm4
 ████████  ████████  ████████     WM Theme: Matcha-sea
 ████████  ████████  ████████     GTK Theme: Matcha-sea [GTK2]
 ████████  ████████  ████████     Icon Theme: Papirus-Maia
 ████████  ████████  ████████     Font: Noto Sans 10
 ████████  ████████  ████████     Disk: 162G / 907G (19%)
                                  CPU: AMD Ryzen 5 3600 6-Core @ 12x 3.6GHz
                                  GPU: NVIDIA GeForce RTX 2060 SUPER
                                  RAM: 2495MiB / 15939MiB

System:
  Kernel: 6.5.9-1-MANJARO arch: x86_64 bits: 64 compiler: gcc v: 13.2.1
    Desktop: Xfce v: 4.18.1 Distro: Manjaro Linux base: Arch Linux
Machine:
  Type: Desktop System: Micro-Star product: MS-7A38 v: 2.0
    serial: <superuser required>
  Mobo: Micro-Star model: B350M PRO-VDH (MS-7A38) v: 2.0
    serial: <superuser required> UEFI-[Legacy]: American Megatrends v: A.JM
    date: 06/24/2019
Battery:
  Device-1: hidpp_battery_0 model: Logitech G304 Lightspeed Wireless Gaming
    Mouse charge: 100% (should be ignored) status: discharging
CPU:
  Info: 6-core model: AMD Ryzen 5 3600 bits: 64 type: MT MCP arch: Zen 2
    rev: 0 cache: L1: 384 KiB L2: 3 MiB L3: 32 MiB
  Speed (MHz): avg: 2440 high: 3600 min/max: 2200/3600 boost: enabled cores:
    1: 3001 2: 1994 3: 2200 4: 2001 5: 2200 6: 3002 7: 3000 8: 2030 9: 2056
    10: 2200 11: 1998 12: 3600 bogomips: 86424
  Flags: avx avx2 ht lm nx pae sse sse2 sse3 sse4_1 sse4_2 sse4a ssse3 svm
Graphics:
  Device-1: NVIDIA TU106 [GeForce RTX 2060 SUPER] driver: nvidia v: 470.223.02
    arch: Turing bus-ID: 29:00.0
  Device-2: Logitech HD Pro Webcam C920 driver: snd-usb-audio,uvcvideo
    type: USB bus-ID: 1-3:2
  Display: x11 server: X.Org v: 21.1.9 driver: X: loaded: nvidia gpu: nvidia
    resolution: 1: 3440x1440 2: 1920x1080~120Hz
  API: OpenGL Message: Unable to show GL data. glxinfo is missing.
Audio:
  Device-1: NVIDIA TU106 High Definition Audio driver: snd_hda_intel v: kernel
    bus-ID: 29:00.1
  Device-2: AMD Starship/Matisse HD Audio vendor: Micro-Star MSI
    driver: snd_hda_intel v: kernel bus-ID: 2b:00.4
  Device-3: Logitech HD Pro Webcam C920 driver: snd-usb-audio,uvcvideo
    type: USB bus-ID: 1-3:2
  Device-4: Logitech [] driver: hid-generic,snd-usb-audio,usbhid type: USB
    bus-ID: 5-1:2
  API: ALSA v: k6.5.9-1-MANJARO status: kernel-api
  Server-1: JACK v: 1.9.22 status: off
  Server-2: PipeWire v: 0.3.83 status: off
  Server-3: PulseAudio v: 16.1 status: active
Network:
  Device-1: Realtek RTL8111/8168/8411 PCI Express Gigabit Ethernet
    vendor: Micro-Star MSI driver: r8169 v: kernel port: f000 bus-ID: 25:00.0
  IF: enp37s0 state: up speed: 1000 Mbps duplex: full mac: <filter>
Drives:
  Local Storage: total: 953.87 GiB used: 159.15 GiB (16.7%)
  ID-1: /dev/nvme0n1 vendor: Samsung model: MZVL21T0HCLR-00B00
    size: 953.87 GiB temp: 38.9 C
Partition:
  ID-1: / size: 896.52 GiB used: 159.15 GiB (17.8%) fs: ext4
    dev: /dev/nvme0n1p1
Swap:
  ID-1: swap-1 type: partition size: 41.97 GiB used: 0 KiB (0.0%)
    dev: /dev/nvme0n1p2
Sensors:
  System Temperatures: cpu: 68.8 C mobo: N/A gpu: nvidia temp: 46 C
  Fan Speeds (rpm): N/A gpu: nvidia fan: 31%
Info:
  Processes: 288 Uptime: 22m Memory: total: 16 GiB available: 15.57 GiB
  used: 3.01 GiB (19.3%) Init: systemd Compilers: gcc: 13.2.1 clang: 16.0.6
  Packages: 1266 Shell: Bash v: 5.2.15 inxi: 3.3.31

Но недавно при запуске игры Insurgency Sandstorm система начала сначала зависать, а после отвисания и сворачивании зависшей игры при запуске чего либо получаю ошибку «Не удалось выполнить дочерний процесс name (Ошибка ввода/вывода)» Что самое интересное другие игры столь же требовательные работают нормально. Пробовал переустанавливать игру, откатываться до бекапа когда всё точно работало (TimeShift), переустанавливать драйвера для видеокарты и ничего не помогает. Пробовал проверять диск через fsck но ничего критичного он не показывает. Из вариантов осталось только переустановка системы. Кто может подсказать возможную причину? journalctl иногда сыпет вот такие ошибки, но работоспособность это не влияет

ноя 08 19:32:08 enotke-ms7a38 kernel: nvme 0000:01:00.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, (Receiver ID)
ноя 08 19:32:08 enotke-ms7a38 kernel: nvme 0000:01:00.0:   device [144d:a80a] error status/mask=00000001/0000e000
ноя 08 19:32:08 enotke-ms7a38 kernel: nvme 0000:01:00.0:    [ 0] RxErr                  (First)


Последнее исправление: Enot (всего исправлений: 2)

driver: nvidia v: 470.223.02

Зачем такое старьё? Последняя версия - 535.х

Кто может подсказать возможную причину?

Интуиция подсказывает мне, что игра заполняет всю свободную оперативку, система лезет в своп и тут происходит что-то нехорошее.

Попробуй вручную прогнать fstrim на всех разделах.

alex1101
()

Вывод должен быть примерно таким

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        49 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    1%
Data Units Read:                    7,398,740 [3.78 TB]
Data Units Written:                 22,804,075 [11.6 TB]
Host Read Commands:                 102,994,212
Host Write Commands:                732,313,457
Controller Busy Time:               2,096
Power Cycles:                       761
Power On Hours:                     1,208
Unsafe Shutdowns:                   19
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               49 Celsius
Temperature Sensor 2:               55 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
No Errors Logged

Тебя по большей части интересуют

Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Jefail ★★★★
()
Ответ на: комментарий от alex1101

SWAP никак не должен влиять на общую работоспособность системы. Это абстракция, ей без разницы куда данные складывать, в RAM или в Stable Storage (любой другой энергонезависимый накопитель)

Jefail ★★★★
()
Ответ на: комментарий от Jefail
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.5.9-1-MANJARO] (local build)
Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Number:                       SAMSUNG MZVL21T0HCLR-00B00
Serial Number:                      S676NU0W550874
Firmware Version:                   GXA7801Q
PCI Vendor/Subsystem ID:            0x144d
IEEE OUI Identifier:                0x002538
Total NVM Capacity:                 1 024 209 543 168 [1,02 TB]
Unallocated NVM Capacity:           0
Controller ID:                      6
NVMe Version:                       1.3
Number of Namespaces:               1
Namespace 1 Size/Capacity:          1 024 209 543 168 [1,02 TB]
Namespace 1 Utilization:            210 741 805 056 [210 GB]
Namespace 1 Formatted LBA Size:     512
Namespace 1 IEEE EUI-64:            002538 b531a2f119
Local Time is:                      Wed Nov  8 20:56:34 2023 +11
Firmware Updates (0x16):            3 Slots, no Reset required
Optional Admin Commands (0x0017):   Security Format Frmw_DL Self_Test
Optional NVM Commands (0x0057):     Comp Wr_Unc DS_Mngmt Sav/Sel_Feat Timestmp
Log Page Attributes (0x0e):         Cmd_Eff_Lg Ext_Get_Lg Telmtry_Lg
Maximum Data Transfer Size:         128 Pages
Warning  Comp. Temp. Threshold:     81 Celsius
Critical Comp. Temp. Threshold:     85 Celsius

Supported Power States
St Op     Max   Active     Idle   RL RT WL WT  Ent_Lat  Ex_Lat
 0 +     8.37W       -        -    0  0  0  0        0       0
 1 +     8.37W       -        -    1  1  1  1        0     200
 2 +     8.37W       -        -    2  2  2  2        0     200
 3 -   0.0500W       -        -    3  3  3  3     2000    1200
 4 -   0.0050W       -        -    4  4  4  4      500    9500

Supported LBA Sizes (NSID 0x1)
Id Fmt  Data  Metadt  Rel_Perf
 0 +     512       0         0

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        40 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    8 583 252 [4,39 TB]
Data Units Written:                 4 813 929 [2,46 TB]
Host Read Commands:                 72 745 990
Host Write Commands:                40 277 250
Controller Busy Time:               622
Power Cycles:                       182
Power On Hours:                     129
Unsafe Shutdowns:                   78
Media and Data Integrity Errors:    0
Error Information Log Entries:      0
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               40 Celsius
Temperature Sensor 2:               48 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
No Errors Logged

Self-test Log (NVMe Log 0x06)
Self-test status: No self-test in progress
No Self-tests Logged

Enot
() автор топика
Ответ на: комментарий от Enot

Стоит открыть для себя zram: https://wiki.archlinux.org/title/Zram — обрати внимание, так как при выходе из сна Linux грузится из swap, то при zram не будет сон работать — но производительность будет лучше.

Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Enot

Samsung печально известен тем, что у него очень кривые прошивки SSD, особенно касательно работы с Linux, попробуй обновить.

Лучше перед этим сделай полный бекап на внешний ЖД, а в идеале после бекапа обнови прошивку SSD, форматни SSD целиком, проверь всю поверхность на ошибки, снова форматни в 0 и поставь ОС заново, чтобы все ФС были отформатированы снова.

Можешь на сей раз выбрать zram прямо в установщике Manjaro. И раз диск ненадежен, наверное лучше использовать ext4 как основную ФС, потому что она самая дубовая, и больше шанс восстановить данные в случае проблем с SSD.

Vsevolod-linuxoid ★★★★★
()
Последнее исправление: Vsevolod-linuxoid (всего исправлений: 4)
Ответ на: комментарий от alex1101

У меня несколько лет своп на старом ssd, проблем нет.

Старые SSD с однослойной памятью чисто физически надежнее современных с 3-мерной, читай: https://3dnews.ru/938764/resursnie-ispitaniya-ssd-obnovlyaemiy-material

Неудачные модели есть у всех производителей.

Не спорю, но не все аж в blacklist ядра попадают. Я перед покупкой нового SSD или HDD всегда проверяю файл /drivers/ata/libata-core.c в исходниках текущего ядра Linux.

И сейчас там про Samsung:

	/* These specific Samsung models/firmware-revs do not handle LPM well */
	{ "SAMSUNG MZMPC128HBFU-000MV", "CXM14M1Q", ATA_HORKAGE_NOLPM, },
	{ "SAMSUNG SSD PM830 mSATA *",  "CXM13D1Q", ATA_HORKAGE_NOLPM, },
	{ "SAMSUNG MZ7TD256HAFV-000L9", NULL,       ATA_HORKAGE_NOLPM, },
	{ "SAMSUNG MZ7TE512HMHP-000L1", "EXT06L0Q", ATA_HORKAGE_NOLPM, },

и

	/* devices that don't properly handle queued TRIM commands */
	{ "Samsung SSD 840*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM, },
	{ "Samsung SSD 850*",		NULL,	ATA_HORKAGE_NO_NCQ_TRIM |
						ATA_HORKAGE_ZERO_AFTER_TRIM, },
Vsevolod-linuxoid ★★★★★
()
Ответ на: комментарий от Vsevolod-linuxoid

/drivers/ata/libata-core.c

Если ты не заметил, там также прописано немало других производителей.

А конкретно у Самсунга заблокана одна необязательная опция в TRIM. Записи других производителей местами выглядят куда более пугающими.

Кстати, там есть и Samsung SSD 860*, который у меня без проблем отработал уже:

9 Power_On_Hours            =    38086 [h]
...
177 Wear_Leveling_Count       =       97 [%]

В общем, Всеволод, эксперт из тебя так себе)

Старые SSD с однослойной памятью

Насколько я знаю, слои это про сами чипы (есть 80-слойные, есть 96-слойные, и т.д.), а slc/mlc/tlc - это про количество уровней (битов) в отдельных ячейках. Тот ssd у меня на mlc, причём размером всего 80 ГБ.

9 Power_On_Hours            =    56972 [h]
...
233 Media_Wearout_Indicator   =       90 [%]

Так-то да, теоретически tlc намного менее надёжны, чем mlc, но на практике есть ещё куча факторов. Я сомневаюсь, что tlc ssd можно протереть до дыр за год обычного десктопного использования, пусть даже со свопом.

alex1101
()
Ответ на: комментарий от Vsevolod-linuxoid

Все у него в порядке с SSD. Ошибки из dmesg известны, не имеют отношения к делу, на работоспособность не влияют. Только засоряют лог и могут снижать производительность(а могут и не снижать). Это, скорее, проблема AMD.

Полностью, однако, поддерживаю тезис о том, что прошивку надо обновить в целях профилактики. Нет, вру, не поддерживаю: прошивка у него тоже самая новая.

ТС: Ставить M.2 SSD в десктоп/сервер, т.е. туда, где есть место для нормального – последнее дело. Тем более, если такой дикий оверпрайс.

i586 ★★★★★
()
Последнее исправление: i586 (всего исправлений: 2)
Ответ на: комментарий от Vsevolod-linuxoid

M.2 вообще-то быстрее SATA. Или ты предлагаешь PCI-e ставить?

Стандартные серверные U.2 накопители. Здесь же не в интерфейсе дело, это все равно pcie, а в буфере, в охлаждении, в избыточности, в защите от потери питания и прочих штуках, а самое главное – это дешевле. Последние годы в форм-факторе м2 ничего серьезного не выпускается ввиду отсутствия спроса, очевидно.

Зато появились самсунги 980/990, но за такие невероятные деньги, за которые недавно можно было какой-нибудь 4610 или 4620 купить.

i586 ★★★★★
()
Последнее исправление: i586 (всего исправлений: 1)
Ответ на: комментарий от Vsevolod-linuxoid

Запросто, swap на ssd вместо zram всегда риск

Вот вообще не риск, и даже не высокий износ. Главное не зажимать доступный размер для балансировки - т.е. выделить своп большим.

Причём вместо zram надо использовать zswap - меньше i/o. А ещё полезно выкрутить /proc/sys/vm/page-cluster в побольше. Это количество страниц, которые будут сбрасываться в своп одним пакетом - хорошо для оптимизации записи, а если у ssd большие физические блоки (я слышал у некоторых там под четверть мегабайта), то лучше чтобы пакет свопа был не меньше.

kirill_rrr ★★★★★
()