LINUX.ORG.RU

Железо помирает или виновато новое ядро?

 , ,


0

2

arch, amd e-450, ssd.

Прилетело новое ядро 4.12, обновил, заодно ещё решил затестить linux-zen, тоже установил.

1. linux-zen 4.12. Вскоре после перезагрузки всё повисло и экран стал представлять из себя разноцветную абракадабру. Перезагрузился, вскоре опять завис - рабочий стол нормально видно, но мышь и клава не работали.

2. Вернулся на linux 4.12. Опять завис. В этот момент копировались файлы по ftp (сраный mtp, пусть вертятся в гробу его создатели), Картинка на экране зависала (прогрессбары в файлзилле), отвисала, но видно что комп живой, хоть мышь и клава опять отвалились (тут я мог бы sysrq reisub попробовать, но я не включал реагирование на sysrq).

3. Перезагрузка, вернее попытка. Появилось boot logo биоса и потом только курсор, т.е. даже до grub'а не дошло. Пробовал перезагружаться несколько раз, выдергивать питание и так оставлять на 10 минут, всё бестолку.

4. В биосе указал загрузку с флешки (и ссд, и флешка там видны нормально, как, впрочем, и в загруженном онтопике) и, о, чудо, появился grub и я смог загрузиться в рачик. Что довольно странно, должно ведь было с флешки грузиться.

5. На этом компе до сих пор всё работало очень стабильно - мог скачать терабайт дистрибутивов линукса, читать лор с 40 открытыми вкладками в хромиуме, копировать скаченные дистрибутивы на nas - и так недели две (не больше, потом перезагрузка после обновлений). Проблемы если и были, то софтовые (скажем, упадёт smplayer и утянет за собой cinnamon, или вон в очередной раз попытаюсь по mtp телефон подключить).

6. ssd? До сих пор на него нареканий не было. Самое главное и так забекаплено, остальное хочу в течении недели рассовать по углам и хотя бы попробовать скопировать весь ссд в /dev/null. Как еще протестировать? Вот смарт

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.12.3-1-ARCH] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Marvell based SanDisk SSDs
Device Model:     SanDisk SDSSDHII480G
Serial Number:    serialserial
LU WWN Device Id: 5 001b44 e99c589e2
Firmware Version: X31200RL
User Capacity:    480,103,981,056 bytes [480 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ACS-2 T13/2015-D revision 3
SATA Version is:  SATA 3.2, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Tue Aug  1 14:57:04 2017 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(    0) seconds.
Offline data collection
capabilities: 			 (0x11) SMART execute Offline immediate.
					No Auto Offline data collection support.
					Suspend Offline collection upon new
					command.
					No Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					No Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 (  10) minutes.

SMART Attributes Data Structure revision number: 4
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   ---    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   253   100   ---    Old_age   Always       -       1527
 12 Power_Cycle_Count       0x0032   100   100   ---    Old_age   Always       -       73
165 Total_Write/Erase_Count 0x0032   100   100   ---    Old_age   Always       -       94531944961
166 Min_W/E_Cycle           0x0032   100   100   ---    Old_age   Always       -       1
167 Min_Bad_Block/Die       0x0032   100   100   ---    Old_age   Always       -       38
168 Maximum_Erase_Cycle     0x0032   100   100   ---    Old_age   Always       -       43
169 Total_Bad_Block         0x0032   100   100   ---    Old_age   Always       -       0
171 Program_Fail_Count      0x0032   100   100   ---    Old_age   Always       -       0
172 Erase_Fail_Count        0x0032   100   100   ---    Old_age   Always       -       0
173 Avg_Write/Erase_Count   0x0032   100   100   ---    Old_age   Always       -       18
174 Unexpect_Power_Loss_Ct  0x0032   100   100   ---    Old_age   Always       -       59
187 Reported_Uncorrect      0x0032   100   100   ---    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   056   047   ---    Old_age   Always       -       44 (Min/Max 21/47)
199 SATA_CRC_Error          0x0032   100   100   ---    Old_age   Always       -       0
230 Perc_Write/Erase_Count  0x0032   100   100   ---    Old_age   Always       -       2388056081212
232 Perc_Avail_Resrvd_Space 0x0033   100   100   004    Pre-fail  Always       -       100
233 Total_NAND_Writes_GiB   0x0032   100   100   ---    Old_age   Always       -       8382
234 Perc_Write/Erase_Ct_BC  0x0032   100   100   ---    Old_age   Always       -       10465
241 Total_Writes_GiB        0x0030   253   253   ---    Old_age   Offline      -       2382
242 Total_Reads_GiB         0x0030   253   253   ---    Old_age   Offline      -       4469
244 Thermal_Throttle        0x0032   000   100   ---    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]

Selective Self-tests/Logging not supported

7. Ядро? Может кто слышал про проблемы с 4.12? В журнале особо ничего нет кроме этого

Jul 31 23:10:36 pcname kernel: clocksource: timekeeping watchdog on CPU0: Marking clocksource 'tsc' as unstable because the skew is too large:
Jul 31 23:10:49 pcname kernel: clocksource:                       'hpet' wd_now: ffffffff wd_last: 31f9f2c6 mask: ffffffff
Jul 31 23:10:49 pcname kernel: clocksource:                       'tsc' cs_now: 79d9f496f7be cs_last: 79d9b0d8c8f2 mask: ffffffffffffffff
Jul 31 23:10:49 pcname kernel: sched_clock: Marking unstable (81350656736096, 538555237)<-(81351291594515, -96303182)
Jul 31 23:10:49 pcname kernel: tsc: Marking TSC unstable due to clocksource watchdog
Jul 31 23:10:49 pcname kernel: ohci-pci 0000:00:12.0: HcDoneHead not written back; disabled
Jul 31 23:10:49 pcname kernel: ohci-pci 0000:00:12.0: HC died; cleaning up
Jul 31 23:10:49 pcname kernel: usb 6-1: USB disconnect, device number 2
Jul 31 23:10:49 pcname kernel: clocksource: Switched to clocksource hpet
Jul 31 23:10:49 pcname kernel: usb 6-3: USB disconnect, device number 3

Ну так пробуй старое ядро или венду.

упадёт smplayer и утянет за собой cinnamon

Фига се софтовые. При сбойном железе как раз софт валится.

anonymous
()
Ответ на: комментарий от arson
UUID=92ccbb7f-feae-4dd4-b187-de6caec198a2 /boot ext4 defaults,rw,noatime,discard 0 0
UUID=9b12a676-c518-4458-b9e7-5aa3b02846eb / ext4 defaults,rw,noatime,discard 0 1
UUID=375e4165-7acb-4fcb-869c-fb50dd20b0b5 none swap defaults 0 0
UUID=a6c1dd9e-a55d-4560-905f-296b5b38377c /home/mounts/data auto nosuid,nodev,nofail,x-gvfs-show,x-gvfs-name=data 0 0
onlybugs ★★
() автор топика
Ответ на: комментарий от anonymous

Фига се софтовые. При сбойном железе как раз софт валится.

Вот пролистываю сериал, на очередном файле (обычно такое случается сразу после перемотки) smplayer и cinnamon вылетают. Потом опять воспроизводишь этот файл - и всё нормально до следующего раза.

onlybugs ★★
() автор топика
Ответ на: комментарий от post-factum

Сколько его вообще гонять нужно? От десяти минут до пяти часов (на других компах) гонял, пока ни разу не столкнулся с битой оперативкой.

onlybugs ★★
() автор топика
Ответ на: комментарий от onlybugs

Ставлю на железо. Но для чистоты эксперимента, проверял на других плеерах? А если смотреть фильмы с другого носителя?

InterVi ★★★★★
()
Ответ на: комментарий от onlybugs

Ты одиночные тесты с прогонами не путаешь? Потому что если так, я бы задумался о железе. Память должна читаться и писаться с одинаковой скоростью.

post-factum ★★★★★
()
Ответ на: комментарий от anonymous

mprime blend

Torture Test completed 63 tests in 7 hours, 34 minutes - 0 errors, 0 warnings.

onlybugs ★★
() автор топика

Кулера не повставали нигде? Может что перегревается? Конденсаторов дутых на материке (можно ещё и в БП посмотреть) нет?

Ну и всякие там шлейфы проверить

samson ★★
()
Последнее исправление: samson (всего исправлений: 2)
Ответ на: комментарий от samson

Кулер крутится, температуры (цп и ссд в норме), бп ноутбучный. Мп чтобы увидеть надо разбирать, а разборка там не очень простая, и так уже много ушек пластмассовых пообрывал. Как-нибудь разберу, но так вроде более-менее стабильно работает.

Меня беспокоят эти несколько внезапных зависаний и дальнейшая неспособность даже grub загрузить (т.е. я и на горячую пробовал пускать, и после ночи простаивания в выключенном виде).

onlybugs ★★
() автор топика
Ответ на: комментарий от onlybugs

А другая система загруженная с флешки работает нормально под нагрузкой? Архивы большие посоздавать, память забить и т.д...

samson ★★
()
Ответ на: комментарий от samson

Не пробовал, ведь и эта пока стабильно работает. Плюс к не описанному выше, да, малость бекапы ещё делал. Пару архивов на 3ГБ и один на 15, без проблем.

onlybugs ★★
() автор топика
Ответ на: комментарий от onlybugs

Уточню. Вот после обновления ядра за одни сутки случилась пачка зависаний, сейчас всё спокойно

onlybugs ★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.