Решил подделиться тут продолжая комментарий: vm.swappiness. Так ли нужен? (комментарий) чтобы если у кого-то случится подобное потратили меньше времени, чем я чтобы восстановить/скопировать данные
Значит есть у меня один SSD на 2Tb XPG SX8200 Pro PCIe Gen3x4 M.2 2280
, прожил 2 года и 3 месяца (думать много это или мало, решать вам, по мне нормально) после того как SSD «умирает» его контроллер переходит в режим только чтение. Причем случиться это может неожиданно, а это значит что данные с него вы скопировать сможете, но целостность фс при этом не гарантирована, а прогнать fsck сверху вы не сможете, так как устроиство только ro. Если для раздела нужен fsck, то вполне возможно, что если вы захотите просто смонтировать ssd, то на на копировании определенных данных устроиство ssd просто исчезнет у вас из ОС и даже с UEFI, до полного цикла выключение/включение, как это было у меня.
На данном этапе понадобиться принять решение, забить на данные, воспользоваться бэкапом или уже все-таки скопировать данные на новое устроиство. Хоть на важные данные у меня и были резервные копии. Все-таки есть еще и рабочие данные и другие данные, которые все равно бы терять не хотелось, поэтому мной было принять решение копировать/восстанавливать.
Что надобится:
Устройство как минимум в два раза большее по объему (в моем случае таким устройством выступил новый 4Tb SSD).
Желательно отдельный компьютер на который вы сможете установить новый и старый SSD. В моем случае я затупил и использовал тот же самый ноутбук. Если бы я копировал на другом компьютере, было бы быстрее.
Процесс:
- Вы подключили новый SSD, в моем случае новый 4Tb SSD с ext4.
Далее нужно установить gddrescue (
ddrescue
) и запустить копирование нужного раздела (в моем случае один / ext4 со всем) в файл на 4Tb SSD.
ddrescue /dev/nvme0n1p2 /mnt/test/backup.raw ~/log_file --try-again --force --verbose
Выглядит так
- После вам нужно натравить fsck (-y) на файл созданный ddrescue и это возможно будет не быстро.
fsck.ext4 -fyv backup.raw
- После того как fsck прогонится над файлом, можно монтировать и копировать файлы.
Так что если вы монтируйте и копируйте на один и тот же SSD, то понадобится x2 места (в моем случае) 1906GB и скопировал я данных еще на 1800GB
mount backup.raw /mnt/new_endpoint/
Потенциальные ответы на вопросы:
- Покажи smart:
smartctl 7.4 2023-08-01 r5530 [x86_64-linux-6.8.0-51-generic] (local build)
Copyright (C) 2002-23, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF SMART DATA SECTION ===
SMART/Health Information (NVMe Log 0x02)
Critical Warning: 0x00
Temperature: 26 Celsius
Available Spare: 100%
Available Spare Threshold: 10%
Percentage Used: 21%
Data Units Read: 1,154,348,897 [591 TB]
Data Units Written: 959,579,774 [491 TB]
Host Read Commands: 9,440,358,764
Host Write Commands: 4,773,001,703
Controller Busy Time: 58,280
Power Cycles: 410
Power On Hours: 20,944
Unsafe Shutdowns: 139
Media and Data Integrity Errors: 153,054
Error Information Log Entries: 0
Warning Comp. Temperature Time: 0
Critical Comp. Temperature Time: 0
Thermal Temp. 1 Transition Count: 2561
Thermal Temp. 2 Transition Count: 48
Thermal Temp. 1 Total Time: 46102
Thermal Temp. 2 Total Time: 240
- На диск гарантия 5 лет, у тебя же проработал меньше?
Гарантия от продавца меньше, скорее всего можно отправить диск ADATA, но так как данные на нем как-бы зависают в ro и не весь диск был зашифрован, да и стоит он сейчас уже мало, отправлять врядли буду. Только если каким-то образом перепрошить диск и отправить без данных, но не думаю что стоит на это тратить время. Пока вот больше думаю разбить его возможно, снимок данных в ro по-моему очень удобно для ББ
- Как использовал?
Я больше гоню на пересборку фронтенда размером 2GB по несколько раз в день. Да еще chia плотил на нем и swap на нем был в 20Gb, ну и еще нода блокчейна локальная на 900гб, несколько subgraph’ов которые приходилось на сотни гб, которые иногда приходилось синхронизировать по несколько раз в день. Но в общем я отношу это к обычному использованию.
- Экзотическая фс
Так как контроллер SSD может рандомно в режим чтения перейти, то часть данных может повредиться, как это COW переживет, это как повезет, но скорее всего будет все нормально. Не думаю что проверка чексумм для файлов как-то поможет, так как контроллер будет перезаписывать ячейки до последнего, и пока SSD будет работать нормально файлов с битыми суммами не появится.
- TBW ssd?
1280 TBW. По факту записано только 491 TB