Тут было много тем про «сколько живут SSD», не являются ли такие то показатели в смарте сигналом к скорой смерти и пр.
Поэтому я решил поделиться своим наблюдением, может кому-то оно и будет полезным или интересным.
Это мой первый SSD диск, который я купил, и который у меня умер, хотя точнее сказать, что он доживает последние дни.
Этот диск у меня появился вместе с ноутбуком Thinkpad x301, который я купил в далеком 2009 году, и с тех пор он очень долго был моей основной рабочей машиной. Только последние несколько лет я сижу на десктопе, но ноут все также активно использовал на работе и на даче.
Нагрузка на диск была разной, были и компиляции системы (с самого начала на нем была Gentoo), и работы с базами данных, и полнодисковое шифрование с перезаписью всего объема. Оперативы на нем всего 8GB и это максимум, который можно поставить, так что диск пользовался только так.
Так вот вчера я заметил, что при включении он начал «тупить»:
dmesg:
[ 8.525965] ata2: link is slow to respond, please be patient (ready=0)
[ 13.215966] ata2: COMRESET failed (errno=-16)
[ 18.585964] ata2: link is slow to respond, please be patient (ready=0)
[ 23.275963] ata2: COMRESET failed (errno=-16)
[ 28.645962] ata2: link is slow to respond, please be patient (ready=0)
[ 55.725969] random: crng init done
[ 58.325965] ata2: COMRESET failed (errno=-16)
[ 58.328197] ata2: limiting SATA link speed to 1.5 Gbps
[ 63.345965] ata2: COMRESET failed (errno=-16)
[ 63.348207] ata2: reset failed, giving up
А в smart начал резко расти параметр
233 Media_Wearout_Indicator -O-RCK 001 001 000 - 9556838
полмиллиона добаляется за 20% long selftest’a.
Диск умирает. Он служил верой и правдой с 2009 года, целых 15 лет, большую часть своей жизни работая круглосуточно. Но его время пришло. RIP.
PS: выхлоп smartctl ниже, но к некоторым числам стоит относиться с сомнением, скажем power_on_hours явно уже переполнялись, они сильно меньше того, что фактически было.
=== START OF INFORMATION SECTION ===
Device Model: SAMSUNG MMCQE28G8MUP-0VA
Serial Number: SE928A5371
Firmware Version: VAM08L1Q
User Capacity: 128,035,676,160 bytes [128 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
TRIM Command: Unavailable
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ATA/ATAPI-7 T13/1532D revision 1
Local Time is: Thu Feb 22 21:48:28 2024 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
AAM feature is: Unavailable
APM feature is: Unavailable
Rd look-ahead is: Enabled
Write cache is: Enabled
DSN feature is: Unavailable
ATA Security is: Disabled, frozen [SEC2]
Wt Cache Reorder: Unavailable
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAGS VALUE WORST THRESH FAIL RAW_VALUE
9 Power_On_Hours -O--CK 093 093 000 - 32660
12 Power_Cycle_Count -O--CK 097 097 000 - 2873
175 Program_Fail_Count_Chip -O--CK 100 100 011 - 0
176 Erase_Fail_Count_Chip -O--CK 100 100 011 - 0
177 Wear_Leveling_Count PO--C- 098 098 023 - 1902
178 Used_Rsvd_Blk_Cnt_Chip PO--C- 085 085 011 - 18
179 Used_Rsvd_Blk_Cnt_Tot PO--C- 097 097 010 - 111
180 Unused_Rsvd_Blk_Cnt_Tot PO--C- 097 097 010 - 3793
181 Program_Fail_Cnt_Total -O--CK 100 100 010 - 0
182 Erase_Fail_Count_Total -O--CK 100 100 010 - 0
183 Runtime_Bad_Block PO--C- 100 100 010 - 0
187 Reported_Uncorrect PO--CK 099 099 000 - 3
195 Hardware_ECC_Recovered -O-RC- 199 199 000 - 3
198 Offline_Uncorrectable ----CK 100 100 000 - 0
199 UDMA_CRC_Error_Count -OSRCK 253 253 000 - 0
233 Media_Wearout_Indicator -O-RCK 001 001 000 - 9556838
234 Unknown_Attribute -O--C- 100 100 000 - 0
235 Unknown_Attribute -O--C- 100 100 000 - 0
236 Unknown_Attribute -O--C- 099 099 000 - 2188
237 Unknown_Attribute -O--C- 099 099 000 - 2468
238 Unknown_Attribute -O--C- 100 100 000 - 0
||||||_ K auto-keep
|||||__ C event count
||||___ R error rate
|||____ S speed/performance
||_____ O updated online
|______ P prefailure warning
SMART Extended Comprehensive Error Log Version: 1 (1 sectors)
No Errors Logged
Warning! SMART Extended Self-test Log Structure error: invalid SMART checksum.
SMART Extended Self-test Log Version: 1 (1 sectors)
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Completed: read failure 80% 32659 79765440
# 2 Extended offline Completed: read failure 80% 32659 79765440
# 3 Extended offline Completed: read failure 80% 32659 79765440
# 4 Short offline Completed without error 00% 29479 -
# 5 Short offline Completed without error 00% 29311 -
# 6 Short offline Completed without error 00% 29151 -
# 7 Short offline Completed without error 00% 28996 -
SATA Phy Event Counters (GP Log 0x11)
ID Size Value Description
0x0001 2 0 Command failed due to ICRC error
0x0002 2 0 R_ERR response for data FIS
0x0003 2 0 R_ERR response for device-to-host data FIS
0x0004 2 0 R_ERR response for host-to-device data FIS
0x0005 2 0 R_ERR response for non-data FIS
0x0006 2 0 R_ERR response for device-to-host non-data FIS
0x0007 2 0 R_ERR response for host-to-device non-data FIS
0x0008 2 0 Device-to-host non-data FIS retries
0x0009 2 21 Transition from drive PhyRdy to drive PhyNRdy
0x000a 2 2 Device-to-host register FISes sent due to a COMRESET
0x000b 2 0 CRC errors within host-to-device FIS
0x000d 2 0 Non-CRC errors within host-to-device FIS
0x000f 2 0 R_ERR response for host-to-device data FIS, CRC
0x0010 2 0 R_ERR response for host-to-device data FIS, non-CRC
0x0012 2 0 R_ERR response for host-to-device non-data FIS, CRC
0x0013 2 0 R_ERR response for host-to-device non-data FIS, non-CRC
PPS:
x301 ~ # hdparm -tT --direct /dev/sda
/dev/sda:
Timing O_DIRECT cached reads: 212 MB in 2.01 seconds = 105.44 MB/sec
Timing O_DIRECT disk reads: 314 MB in 3.01 seconds = 104.25 MB/sec