LINUX.ORG.RU

Греется жесткий диск на ноутбуке


0

1

Ноутбук работал без нареканий около полугода. На обычной подставке можно было нагружать его чем угодно и все было хорошо, но температуру не замерял.

Недавно (несколько месяцев назад) он начал выключаться при нагрузке во время игр. Понятное дело пошел смотреть температуру. На нагрузке дискретная видеокарта и процессор греются в худшем случае градусов до 75 - 80. Решил глянуть температуру жестких дисков. Вот температура при обычной работе:

/dev/sda: KINGSTON SH103S3120G: 42°C or °F

/dev/sdb: WDC WD10JPVT-75A1YT0: 49°C

Attribute 'GPUCoreTemp' (DellPC:8.0): 34.

Core 0: +47.0°C (high = +87.0°C, crit = +105.0°C)

Core 1: +37.0°C (high = +87.0°C, crit = +105.0°C)

Core 2: +44.0°C (high = +87.0°C, crit = +105.0°C)

Core 3: +44.0°C (high = +87.0°C, crit = +105.0°C)

Жесткий диск нагрет даже больше, чем остальные элементы ноутбука. По спецификации на него - до 50ти градусов нормальный режим работы, но даже во время обычной работы температура уже близка к выходу за пределы рабочей температуры.

Во время игр винчестер греется до 63 - 65 и, похоже, ноутбук просто отключается от этого.

Разобрал, прочистил от пыли вентилятор (пыли было очень мало), и это не помогло. Менял местами жесткие диски - не помогло.

Может кто сталкивался с такой проблемой и как-то ее решил? Может имеет смысл как-то принудительно ставить жесткий диск в режим энергосбережения во время таких нагрузок? Как это сделать так, чтобы диск не дергался постоянно.


По спецификации на него - до 50ти градусов нормальный режим работы,

Вы в этом уверены? Обычно у ноутбучных винтов допустима температура заметно побольше. Причём при перегреве срабатывает защита винчестера, оключающая его, а не весь ноут. Или вы про SSD?

mky ★★★★★
()
Ответ на: комментарий от mky

Простите, ошибся.

Из спецификации: Operating temp: 0 to 60 Non-operating temp: -40 to 65

Так что, да. В нормальной работе есть запас в 10 градусов. Но все равно, ноут просто вырубается. Судя по всему когда температура достигает 65 градусов. А потом около пол минуты не подает признаков жизни.

summon
() автор топика

А чего в смарте? Параметр 190, 194?

Alexonline ★★★★
()
Ответ на: комментарий от summon

Присоединяюсь к вопросу про содержимое SMART, и кроме параметров 190, 194 ещё интересует, что в логе температуры — вывод команды ″smartctl -l scttemp /dev/sdb″.

mky ★★★★★
()
Ответ на: комментарий от summon

194 - это температура и она совпадает с выводом hddtemp. Т.е. при обычном использовании 46-50, при играх 60+.

190 - я не смог заставить smartctl показать мне этот параметр.)

summon
() автор топика

Может имеет смысл как-то принудительно ставить жесткий диск в режим энергосбережения во время таких нагрузок? Как это сделать так, чтобы диск не дергался постоянно.

ну вообще-то читай man hdparm про опцию -B.

Но это не поможет, пока ты не добавишь достаточно RAM.

PS: если температура увеличивается, то это признак скорой смерти. Покажи smartctl -a.

emulek
()
Ответ на: комментарий от mky

Причём при перегреве срабатывает защита винчестера, оключающая его, а не весь ноут.

и как весь ноут будет работать, если он постоянно HDD дёргает, а тот вырубился?

emulek
()
Ответ на: комментарий от mky

Вывод ″smartctl -l scttemp /dev/sdb″ после недолгой тестовой нагрузки.

smartctl 6.1 2013-03-16 r3800 [x86_64-linux-3.12.13-gentoo] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF READ SMART DATA SECTION ===
SCT Status Version:                  3
SCT Version (vendor specific):       258 (0x0102)
SCT Support Level:                   1
Device State:                        Active (0)
Current Temperature:                    61 Celsius
Power Cycle Min/Max Temperature:     24/61 Celsius
Lifetime    Min/Max Temperature:     21/68 Celsius
Lifetime    Average Temperature:        39 Celsius
Under/Over Temperature Limit Count:   0/3
SCT Temperature History Version:     2
Temperature Sampling Period:         1 minute
Temperature Logging Interval:        1 minute
Min/Max recommended Temperature:      0/60 Celsius
Min/Max Temperature Limit:           -41/85 Celsius
Temperature History Size (Index):    128 (91)

Index    Estimated Time   Temperature Celsius
  92    2014-03-30 20:31     ?  -
  93    2014-03-30 20:32    51  ********************************
  94    2014-03-30 20:33    52  *********************************
  95    2014-03-30 20:34    52  *********************************
  96    2014-03-30 20:35    51  ********************************
 ...    ..(  5 skipped).    ..  ********************************
 102    2014-03-30 20:41    51  ********************************
 103    2014-03-30 20:42    50  *******************************
 ...    ..(  3 skipped).    ..  *******************************
 107    2014-03-30 20:46    50  *******************************
 108    2014-03-30 20:47    49  ******************************
 ...    ..( 19 skipped).    ..  ******************************
   0    2014-03-30 21:07    49  ******************************
   1    2014-03-30 21:08    48  *****************************
   2    2014-03-30 21:09    49  ******************************
   3    2014-03-30 21:10    48  *****************************
 ...    ..( 40 skipped).    ..  *****************************
  44    2014-03-30 21:51    48  *****************************
  45    2014-03-30 21:52    49  ******************************
  46    2014-03-30 21:53    49  ******************************
  47    2014-03-30 21:54    50  *******************************
  48    2014-03-30 21:55    51  ********************************
  49    2014-03-30 21:56    51  ********************************
  50    2014-03-30 21:57    52  *********************************
 ...    ..(  3 skipped).    ..  *********************************
  54    2014-03-30 22:01    52  *********************************
  55    2014-03-30 22:02    53  **********************************
  56    2014-03-30 22:03    53  **********************************
  57    2014-03-30 22:04    53  **********************************
  58    2014-03-30 22:05    54  ***********************************
  59    2014-03-30 22:06    54  ***********************************
  60    2014-03-30 22:07    55  ************************************
 ...    ..(  2 skipped).    ..  ************************************
  63    2014-03-30 22:10    55  ************************************
  64    2014-03-30 22:11    56  *************************************
 ...    ..(  2 skipped).    ..  *************************************
  67    2014-03-30 22:14    56  *************************************
  68    2014-03-30 22:15    57  **************************************
  69    2014-03-30 22:16    57  **************************************
  70    2014-03-30 22:17    57  **************************************
  71    2014-03-30 22:18    58  ***************************************
 ...    ..(  3 skipped).    ..  ***************************************
  75    2014-03-30 22:22    58  ***************************************
  76    2014-03-30 22:23    59  ****************************************
 ...    ..(  2 skipped).    ..  ****************************************
  79    2014-03-30 22:26    59  ****************************************
  80    2014-03-30 22:27    60  ***************************************+
 ...    ..(  7 skipped).    ..  ***************************************+
  88    2014-03-30 22:35    60  ***************************************+
  89    2014-03-30 22:36    61  ***************************************+
  90    2014-03-30 22:37    61  ***************************************+
  91    2014-03-30 22:38    61  ***************************************+

summon
() автор топика
Ответ на: комментарий от emulek

вывод smartctl -a:

smartctl 6.1 2013-03-16 r3800 [x86_64-linux-3.12.13-gentoo] (local build)
Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Scorpio Blue Serial ATA (AF)
Device Model:     WDC WD10JPVT-75A1YT0
Firmware Version: 01.01A01
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Rotation Rate:    5400 rpm
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   ATA8-ACS (minor revision not indicated)
SATA Version is:  SATA 3.0, 3.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Mar 30 22:48:11 2014 NOVT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (17280) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 188) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x70b5) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   183   180   021    Pre-fail  Always       -       1833
  4 Start_Stop_Count        0x0032   095   095   000    Old_age   Always       -       5785
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       2180
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       551
191 G-Sense_Error_Rate      0x0032   033   033   000    Old_age   Always       -       67
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       47
193 Load_Cycle_Count        0x0032   198   198   000    Old_age   Always       -       8287
194 Temperature_Celsius     0x0022   091   079   000    Old_age   Always       -       56
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   100   253   000    Old_age   Offline      -       0
240 Head_Flying_Hours       0x0032   098   098   000    Old_age   Always       -       2072
241 Total_LBAs_Written      0x0032   200   200   000    Old_age   Always       -       4223351640
242 Total_LBAs_Read         0x0032   200   200   000    Old_age   Always       -       1943982660
254 Free_Fall_Sensor        0x0032   200   200   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1924         -
# 2  Short offline       Completed without error       00%         1         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
summon
() автор топика
Ответ на: комментарий от summon

дык диск старенький, но вроде пока ещё живой. Я бы забил, все мы смертны. ИМХО он своё отработал. Слишком ты его задрочил

4 Start_Stop_Count 0x0032 095 095 000 Old_age Always - 5785

emulek
()
Ответ на: комментарий от emulek
4 Start_Stop_Count        0x0032   095   095   000    Old_age   Always       -       5785

Хм. А это разве много? Как я понял не только включение и выключение ноутбука, но еще экономия питания ноутбука увеличивает этот параметр при временной остановке диска. Диску чуть больше года. Причем обычно держу ноут на питании, так что не останавливается диск просто так.

Что значит value у Start_Stop_Count = 095? Это в процентах что-ли?

summon
() автор топика
Ответ на: комментарий от emulek

Но все равно, ноут просто вырубается. Судя по всему когда температура достигает 65 градусов. А потом около пол минуты не подает признаков жизни.

На всякий случай ещё раз повторю:

А потом около пол минуты не подает признаков жизни.

Ни разу не видел комп, который бы настолько обижался, что у него отобрали винт. Если просто удалить винт, то что операционка, что BIOS как-то об этом сообщают.

mky ★★★★★
()

Не там идёшь. Дело не в диске. Реакция была бы другая. Возможно ослабло крепление теплоотвода, высохла термопаста, разгерметизировались термотрубки. Или микротрещина

chg ★★★★★
()
Ответ на: комментарий от chg

Да я так и подумал. Но ведь тогда грелся бы процессор или видеокарта или что-то еще, на что нужен теплоотвод. Но все, вроде, нормально. По этому единственное предположение было - это жесткий диск. (

summon
() автор топика
Ответ на: комментарий от summon

У некоторых винтов smartctl показывает

Min/Max Temperature Limit: 0/0
так что это не важно.

А вот счётчик перегревов:

Under/Over Temperature Limit Count:   0/3
так что ноут отрубается не из-за перегрева винта, точнее не из-за того, что отрубается винт от перегрева. Вполне возможно, что в отрубаниях виноват винт, который сильно греется и нагревает что-то рядом с ним, а может наоборот.

после недолгой тестовой нагрузки.

Какого характера была тестовая нагрузка? Есть возможность погонять ноут с отключенным питанием винчестера, но не убирая его из корпуса?

mky ★★★★★
()
Ответ на: комментарий от summon

Хм. А это разве много? Как я понял не только включение и выключение ноутбука, но еще экономия питания ноутбука увеличивает этот параметр при временной остановке диска.

да, это много.

Start_Stop_Count = 095? Это в процентах что-ли?

яхз. Я на чистое значение(5785) смотрел. Очень уж он часто вырубается и сразу врубается. Учитывая небольшое(сравнительно) число число часов: 2180. Т.е. в среднем каждые 20 минут. Это не очень хорошо для долговечности(хотя экономит заряд батарейки). Т.е. ИМХО возможно в этом причина того, что он приходит в негодность(механика жеж). Т.е. возможно, что разбитая механика теперь требует больше энергии(скорость вращения стабильна, но теперь больше трение из-за дисбаланса).

Это всё конечно предположения только.

emulek
()
Ответ на: комментарий от mky

А потом около пол минуты не подает признаков жизни.

Ни разу не видел комп, который бы настолько обижался, что у него отобрали винт. Если просто удалить винт, то что операционка, что BIOS как-то об этом сообщают.

за то я видел. Если HDD подыхает, и там что-то клинит, то комп зависает. Причём пока HDD холодный, то там ничего не клинит, и загрузка нормально проходит. Потом начинает прогреваться, и именно такая ерунда и происходит.

ЗЫЖ что может сказать ОС про это? Тестирование (POST и OS) на холодном диске идёт. А потом ОС диск не тестирует, а уверенна в том, что он работает (исключая случай отключения, но это совсем особый случай, SATA это допускает и обрабатывает адекватно).

emulek
()
Ответ на: комментарий от mky

так что ноут отрубается не из-за перегрева винта, точнее не из-за того, что отрубается винт от перегрева. Вполне возможно, что в отрубаниях виноват винт, который сильно греется и нагревает что-то рядом с ним, а может наоборот.

Это тоже может быть. Просто я пока не могу понять куда дальше копать.

Under/Over Temperature Limit Count:   0/3

Ну так вот вроде три перегрева было? Хотя, мне кажется он так раз 5 отключался. Потом я просто перестал запускать. Так редко со льдом под дном. )

Какого характера была тестовая нагрузка?

Последний раз он отключился после получаса игры в Dota2 месяца два назад. Я запускал UnigineHeaven бенчмарк, он тоже грелся, но до отрубания я его не довел - жалко стало, хотя крутил его тоже достаточно долго. Игры где графика по проще, он переносит нормально.

Есть возможность погонять ноут с отключенным питанием винчестера, но не убирая его из корпуса?

Гипотетический, такая возможность может быть. Но я пока не хочу этим заниматься.

summon
() автор топика
Ответ на: комментарий от emulek

яхз. Я на чистое значение(5785) смотрел. Очень уж он часто вырубается и сразу врубается. Учитывая небольшое(сравнительно) число число часов: 2180. Т.е. в среднем каждые 20 минут. Это не очень хорошо для долговечности(хотя экономит заряд батарейки). Т.е. ИМХО возможно в этом причина того, что он приходит в негодность(механика жеж). Т.е. возможно, что разбитая механика теперь требует больше энергии(скорость вращения стабильна, но теперь больше трение из-за дисбаланса).

Я посмотрел почему так много остановок было. На питании hdparm -B дает 254. На батарее 1. Я черт знает почему. Залез в конфиг /etc/laptop_mode - там я выставлял сам по 255 на все режимы. Остановил laptop_mode, остановил, на всякий случай lm_sensors. Все равно выставляет 1 при отключении питания и 254 при включении. Вручную через hdparm выставить можно, но до первого изменения питания. Остался только acpi, который судя /etc/acpi/actions не делает ничего, кроме как дергает laptop_mode auto. Еще есть kde которая тоже управляет питанием, но я ума не приложу где там настройки для питания диска. (

summon
() автор топика
Ответ на: комментарий от summon

Еще есть kde которая тоже управляет питанием, но я ума не приложу где там настройки для питания диска. (

ну в центре управления там где-то были. Под рукой нет KDE.

вот, нагуглил: http://rus-linux.net/nlib.php?name=/MyLDP/hard/power/power_in_KDE.html

emulek
()
Ответ на: комментарий от emulek

ну в центре управления там где-то были. Под рукой нет KDE.

Ну там ничего про питание диска нет. Я остановил xdm и вместе с ним и кеды, остановил acpid, остановил lm_sensors, остановил smartd, остановил laptop_mode. Вообщем, ужe все, что хоть как-то отвечает за питание остановил. В голой консольке выдернул шнур зарядки и все равно hdparm -B дает 1, вставляю зарядку hdparm -B дает 254. Что за магия. В биос лезть чтоли?

summon
() автор топика

Вообще, я бы посмотрел по напряжениям. Если есть где просадка по вольтажу, то растет ток, и тут может греться не только диск, но и контроллер, отсюда и вырубание ноута. И начал бы с блока питания.

Alexonline ★★★★
()
Ответ на: комментарий от Alexonline

В идеале(простой способ) поставить другой винт и посмотреть, если, тенденции нет - винт, если так-же - к доктору весь ноут, и винт не приделах.

Alexonline ★★★★
()
Ответ на: комментарий от summon

Ну так вот вроде три перегрева было? Хотя, мне кажется он так раз 5 отключался.

Да, перегрева было три, причём не факт, что они все были длительные, заметные для системы. Процессору вон часто хватает небольшого (0,1 сек) тротлинга, чтобы балансировать на грании перегрева при забитом пылью радиаторе.

Игры где графика по проще, он переносит нормально.

Вот это вот ещё более странно. Ладно, можно предположить, что при интенсивных дисковых операциях винт потребляет больше тока, выделяет больше тепла. Но игры ведь в основном читают данные с диска, а чтение не так затратно, как запись, да и винт в простое тоже постоянно читает блины — просматривает сервометки, корректирует положение головок. И для меня не очевидна связь, что навороченная графика требует заметно большего объёма данных с винта, причём постоянного, раз температура растёт за 20-30 минут.

Но, в общем то, проверьте это с помощью запуска теста чтения данных с винта. Если просто от чтения данных (для начала последовательного, потом из случайных секторов) температура винта растёт и уходит за 60 градусов это одно, а если чтение не разогревает винт, а графика разогревает, то нужно копать глубже. Хотя я не знаю, как в ноуте искать самую горячую деталь. В компе открыл крышку и потыкал пальцем, а в ноут пока залезешь, всё и остынет.

Ещё можно попробовать переставить винты местами, если SSD'шка и на мести WD не будет греться, это одно, а если греется не сам винт, а его место, то это уже другое.

mky ★★★★★
()
Ответ на: комментарий от summon

Неправильно думаешь, попробуй вывернуть ноут кишками наружу и дать ту же нагрузку. Причем растащи все комплектующие как можно дальше друг от друга. Тогда можно будет точно сказать кто виноват.

З.Ы. А картинка стандартная для банального перегрева, но раз почистил, то хз (хотя м.б. термопаста)

З.З.Ы. Говоришь ноут постоянно в розетке. А батарейка там случайно не самоликвидировалась? Попробуй без неё повторить.

aleks13
()
Ответ на: комментарий от aleks13

З.З.Ы. Говоришь ноут постоянно в розетке. А батарейка там случайно не самоликвидировалась? Попробуй без неё повторить.

KDE должен показывать даже ёмкость батареи в процентах от первоначальной, не говоря уж о выходе батареи из строя.

supreme
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.