LINUX.ORG.RU

Как узнать сдох ли диск?

 ,


0

1

Купил я, значит, ноут 1.5 года назад. В нем был встроенный NVME. Я на него накатил Линукс, а под Винду добавил еще один NVME… И вот месяц назад я решил ротировать системы. Второй NVME пошустрее, я на него решил Linux перенести, а на первый - винду. Но вот винда начала у меня ловить бсоды после переезда. Ну ловит бывает… Я сначала думал, что это из-за ее копирования через ntfsclone, но потом я начистую переустановил, и ошибки никуда не исчезли. Решил я проверить память, проц, видеокарту… Прогнал стресс-тесты, БСОДЫ во время них я не ловил, методом исключения остался диск. Я посмотрел логи Винды там ошибки вида «не могу выделить место под страницу». Я пробовал поставить все обновления на винду, обновлял BIOS на материнку, а вот для диска нового фирмваря нету.

И вспомнил тут, что диск у меня себя изначально странно вел (в линупсе). Я ловил ошибки чтения/записи через 20 минут работы. И эту ошибку сразу исправил, дописав в параметры ядра nvme_core.default_ps_max_latency_us=0. Эта настройка отвечает за питаниею. И в Винде по-ходу питание вырубается у диска, она перестает его видеть, и тут ловим бсод. И мне что непонятно: он изначально бракованный или это виндопроблемы? Второе у меня вызывает сомнения, потому как модель ноута довольно популярная. Такое может быть то у меня диск особенынй не такой как у всех?

Модель: WDC PC SN530 SDBPNPZ-512G-1114

Выполнил отключение быстрого старта (Fast Startup):

Win+R
regedit
Computer\HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\Power
HypebootEnabled 0

Запустил кучу торрентов и часов 10 играл. Бсодов пока не было. Но возник вопрос а гарантийный ли это случай? И у меня есть смутные подозрения, что этот баг возникает ТОЛЬКО тогда, когда два NVME, но если проблема с питанием, то почему вырубается только опр диск?

На сл день все повторилось. Те не помогло, не помогает. Если долго бездействует диск, то он уходит в сон.



Последнее исправление: uwuwuu (всего исправлений: 2)
Ответ на: комментарий от rupert

Я все это запускал. У меня сейчас проблема заставить диск отключаться, например, через 10 минут гарантированно, потому как до бсода он может и 13 часов отработать. Его можно будет сдать по гарантии тогда, в нем что-то точно неисправно.

Oleg
Ответил 5 августа
Куплено в Ситилинк
Сам нашел причину BSOD - Панель управления\Все элементы панели управления\Электропитание\Системные параметры, в параметрах завершения работы снять галку напротив "Включить быстрый запуск", в моём ноутбуке стояли M.2 SSD диски WD PC SN530 NVMe 512GB, и не хотели работать в таком режиме. Другие NVMe диски не стал пробовать, огромное ""спасибо"" ACER за убитое время !! :(
uwuwuu
() автор топика
Ответ на: комментарий от Vsevolod-linuxoid

Живее всех живых:

~
❯ sudo smartctl -A /dev/nvme0n1
smartctl 7.3 2022-02-28 r5338 [x86_64-linux-6.2.8-arch1-1] (local build)
Copyright (C) 2002-22, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning:                   0x00
Temperature:                        42 Celsius
Available Spare:                    100%
Available Spare Threshold:          10%
Percentage Used:                    2%
Data Units Read:                    18,815,928 [9.63 TB]
Data Units Written:                 45,812,712 [23.4 TB]
Host Read Commands:                 219,865,790
Host Write Commands:                866,361,754
Controller Busy Time:               1,027
Power Cycles:                       1,550
Power On Hours:                     5,853
Unsafe Shutdowns:                   439
Media and Data Integrity Errors:    0
Error Information Log Entries:      19
Warning  Comp. Temperature Time:    0
Critical Comp. Temperature Time:    0

Error Information Log Entries: 19 эти 19 записей были всегда вроде… Ну год и число точно не растет

uwuwuu
() автор топика
Ответ на: комментарий от sfedosenko

Я сегодня ноут разбирал и переставлял местами диски, после этого он перестал вклюаться. Я вытащил батарею, и он заработал, потом я вернул батарею, и он так же работал. По гарантии оказалось поздно сдавать. Она 12 месяцев, а не 24

uwuwuu
() автор топика
Ответ на: комментарий от uwuwuu

Короче че сегодня я делал:

  • Узнал, что гарантия на ноут 12 месяцев, а значит я в пролете.
  • Хотел поменять местами nvme чтобы проверить точно ли диск косячный, сорвал грани…
  • Надфилем сделать пропил чтобы выкрутить болт плоской отверткой.
  • В процессе металлическая пыль попала куда не надо и закоротила материнку.
  • Я подумал что у меня сдох аккум, подумал вот оно, аккум не держал напряжение… Сейчас куплю новый и все с диском проблема решена. Вынул его, а потом решил попробовать обратно вставить… к разочарованию рабочим оказался.
  • Ноут завелся, что клавиша X перестала работать, значит пыль попала под плату.
  • Решил ее открутить, оказалось, что у меня нет мелкой крестовухи, сходил купил набор отверток.
  • Открутил плату протер все спиртом. Грязи там было дохера.
  • Запустил. Клавиша X работает, но перестали работать USB порты слева.
  • Разобрал ноут, увидел, что не воткнул провод…

Теперь все работает, осталось только узнать какой из дисков отключится, если опять WD, то ну его нахер, я просто куплю новый на 1 терабайт

uwuwuu
() автор топика
Последнее исправление: uwuwuu (всего исправлений: 1)

nvme_core.default_ps_max_latency_us=0
Модель: WDC PC SN530 SDBPNPZ-512G-1114

А ноут не от Lenovo?
Один в один ситуация на ThinkPad E15 с SN530 SDBPMPZ 1Tb во втором слоте M2. Обновил прошивку на ноуте - не помогло. Обновлений для WD нет - эта модель как-бы OEM, нашёл обновление фирмари для WD перепакованное от леновы - оно оказалось уже стоит, той же версии.

С default_ps_max_latency_us=0 не отваливается, работает.

Отваливалось со строкой nvme nvme0: controller is down; will reset: CSTS=0xffffffff, PCI_STATUS=0x10 в dmesg через некоторое время после работы. После перезагрузки - 100% отваливалось с этим сообщением прямо в процессе загрузки.

В винде не проверял. Также попробовал поставить Netac N930ES, так ноут его вообще не увидел на PCI.

И перегрев тут не причём, температура не поднималась свыше 50C.

В тоже время оба накопителя работают идеально в материнской плате B365M D3H от гигабайта, безо всяких опций ядра и заморочек с энергосбережением.

если опять WD, то ну его нахер, я просто куплю новый на 1 терабайт

И не факт, что заведётся.

Suigintou ★★★★★
()
Ответ на: комментарий от Suigintou

Я поставил драйвер для чипсета и поменял слоты в которых были nvme, БСОД перестал ловить. Я подозреваю там какой-то программный баг виндового драйвера, который работает с SSD, типа если WD, то он работает так, если Samsung иначе, а если две эти марки сразу, начинает чудить. Я из-за херни фактически весь ноут раскрутил, все платы пооткрутив и два винта сорвал. В одном пропил делал, а второй удалось шестигранной отверткой выкрутить… Это тот случай когда металл винтов еще мягче и говенее чем у китайской отвертки. Я спецом брал отвертку с мягким металлом чтобы болты эти крутить, и она все равно портит грани!

uwuwuu
() автор топика
Последнее исправление: uwuwuu (всего исправлений: 2)