LINUX.ORG.RU

Переодические зависания и тормоза в Pop_OS. Nvidia драйвер и NVME

 , , ,


0

1

Здравствуйте!

Столкнулся с проблемой – Pop_OS переодически подвисает на рандомных приложениях, такое часто происходит при открытии их магазина, remmina иногда падает по CTRL+V, попытка сделать скриншот новой утилитой из Ubuntu внутри игры наглухо вешает компьютер. Я не умелец в линукс, поэтому не знаю даже куда и посмотреть в терминале, чтобы найти причины своих проблем, поэтому просто скачал себе гномовый журнал и смотрю туда. Честно говоря, инсайтов не много, но, кажется, я нащупал пару вещей. Чаще всего, все эти события сопровождаются в журнале сообщениями об ошибке драйвера nvidia и «Failed to start Application launched by gnome-shell». Если я правильно понял записи в журнале, то у них не очень получается договориться кто приоритетнее или что-то такое. Все эти проблемы всегда сопровождались похожими записями в журнале. Прошу прощения, что это могут быть не очень информативные скрины, но вот привожу примеры того, что видел.

https://disk.yandex.ru/d/wfmBRJRUvlikwA

Есть ещё другое нехорошее подозрение – иногда в логах появлялись записи о предупреждениях или ошибках nvme накопителя. К сожалению, предыдущие случаи не зафиксировал, но на днях произошла ситуация: я оставил компьютер включенным с парой запущенных приложений, отошёл минут на 20, а когда вернулся, то увидел чёрный экран с ошибками чтения nvme. Я, честно говоря, хз проблемы ли с ним – он новый и вроде ошибки я замечал про него редко, но энивэй смущает. Вот тоже привожу фото экрана с ошибками чтения, в момент, когда я вернулся к компьютеру.

https://disk.yandex.ru/d/-hydtrfYpoXEsw

Честно говоря не уверен был какой заголовок написать к теме и что у меня за проблема. Буду крайне благодарен любым идеям по поводу того в чём может крыться корневая проблема и что можно попробовать сделать, в данной ситуации.


Для начала стоит проверить показатели smart вашего SSD, и если с ними всё в порядке, то проверить ФС, например загрузившись в Live-диска и выполнив fsck.ext4 -f /dev/nvme0n1p3.

Rootlexx ★★★★★
()
Ответ на: комментарий от tz4678_2

Мне казалось, что я размечал этот раздел. Нужно его ещё специфически включить как-то?

kirich
() автор топика
Ответ на: комментарий от Rootlexx

А подскажите утилиту для проверки nvme, пожалуйста. Штатная дисковая утилита не понимает, что у nvme можно smart посмотреть – кнопка неактивная.

kirich
() автор топика
Ответ на: комментарий от Aceler

Вот я тоже об этом подумал, когда увидел старый какой-то тред на ЛОРе про этот конкретный диск. Вот теперь интересно как это проверить)

kirich
() автор топика
Ответ на: комментарий от kirich

Под железкой подоазумевается то, куда включен ssd

Прошивку посмотреть smartctl -a /dev/nvme0n1 | grep Firmware

Но да, надо посмотреть smartctl -a /dev/nvme0n1

Dimez ★★★★★
()
Последнее исправление: Dimez (всего исправлений: 2)
Ответ на: комментарий от Dimez

@Rootlexx

Под железкой подоазумевается то, куда включен ssd

Разъём m2 на MSI Mortar B550

smartctl -a /dev/nvme0n1

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        35 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    4 284 314 [2,19 TB]
Data Units Written:                 12 665 386 [6,48 TB]
Host Read Commands:                 42 982 095
Host Write Commands:                214 312 554
Controller Busy Time:               874
Power Cycles:                       314
Power On Hours:                     515
Unsafe Shutdowns:                   51
Media and Data Integrity Errors:    0
Error Information Log Entries:      917
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               35 Celsius
Temperature Sensor 2:               38 Celsius

smartctl -a /dev/nvme0n1 | grep Firmware

Firmware Version:                   2B2QEXM7
Firmware Updates (0x16):            3 Slots, no Reset required

Вот такие результаты. Говорят, что критических предупреждений нет, но 917 логов с ошибками. Можно как-то посмотреть эти логи? Там могут быть ошибки указывающие на проблему?

kirich
() автор топика
Последнее исправление: kirich (всего исправлений: 1)
Ответ на: комментарий от kirich

2B2QEXM7

Последняя прошивка для 970 evo plus v1 (у меня такой же)

Можно как-то посмотреть эти логи?

nvme error-logs, но там ничего интересного обычно.

Dimez ★★★★★
()
Ответ на: комментарий от Dimez

Стоит обновить? Вижу на сайте другую версию. Или стоит буквально последняя доступная для моего диска прошивка?

А что таки может происходить такого, что «Failed to start Application launched by gnome-shell»?

kirich
() автор топика
Ответ на: комментарий от kirich

Попробуй, но 99% не обновится, ибо на сайте прошивка для v2, а у нас v1.

А что таки может происходить такого, что «Failed to start Application launched by gnome-shell»?

Да всё, что угодно, баг gnome-shell, например :)

Dimez ★★★★★
()
Ответ на: комментарий от kirich

Можно как-то посмотреть эти логи?

sudo smartctl -l error /dev/nvme0n1

Я бы ещё запустил расширенную проверку: sudo smartctl -t long /dev/nvme0n1 (пока идёт проверка, компьютером можно пользоваться как обычно). Результаты можно мониторить командой sudo smartctl -l selftest /dev/nvme0n1.

Rootlexx ★★★★★
()
Ответ на: комментарий от Dimez

Лол, то есть всё ещё не оч понятно почему подлагивания могут быть. Просто такие баги происходят довольно регулярно. Может, таки попробую гном почище просто в составе Федоры или убунты, где будто бы побольше активных юзеров-тестировщиков.

kirich
() автор топика
Ответ на: комментарий от Rootlexx

sudo smartctl -t long /dev/nvme0n1

Получил ответ

NVMe device successfully opened

И будто бы больше ничего не происходит

kirich
() автор топика
Ответ на: комментарий от kirich

Эта команда запустила проверку. Как я и написал выше, мониторить её можно с помощью команды sudo smartctl -l selftest /dev/nvme0n1.

Rootlexx ★★★★★
()
Ответ на: комментарий от Rootlexx

Она буквально то же самое возвращает. Утилита предложила использовать -a или -h чтобы посмотреть штуки. Там, будто бы теперь два куска информации, вместо одного ранее.

=== START OF SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        47 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    0%
Data Units Read:                    4 293 042 [2,19 TB]
Data Units Written:                 12 682 610 [6,49 TB]
Host Read Commands:                 43 139 613
Host Write Commands:                214 765 641
Controller Busy Time:               877
Power Cycles:                       315
Power On Hours:                     517
Unsafe Shutdowns:                   51
Media and Data Integrity Errors:    0
Error Information Log Entries:      919
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0
Temperature Sensor 1:               47 Celsius
Temperature Sensor 2:               50 Celsius

Error Information (NVMe Log 0x01, 16 of 64 entries)
Num   ErrCount  SQId   CmdId  Status  PELoc          LBA  NSID    VS
  0        919     0  0x000e  0x4004      -            0     0     -

kirich
() автор топика
Последнее исправление: kirich (всего исправлений: 1)
Ответ на: комментарий от mx__

Попробовал echo $XDG_SESSION_TYPE. Говорит, что X11.

kirich
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.