LINUX.ORG.RU

Непонятная активность винчестера

 


0

1

Заметил непонятное поведение винчестера на ноутбуке.

При фрагментированном чтении/записи диск издаёт частые тихие щелчки, чуть громче кулера. Я так понимаю это абсолютно нормальный звук для винчестеров. Но иногда после завершения операции звук не пропадает, и это уже вроде не нормально.

Звук может исчезнуть, если начнётся операция не фрагментированного чтения/записи и появиться снова после завершения. Может исчезнуть сам через некоторое время (больше 3-4 минут). Не заметил никаких зависимостей от запущенных приложений, той программы, которая обращалась к диску и т.д. Не нашёл способа прервать этот режим, его можно только заглушить какой нибудь дисковой операцией.

iotop и conky во время этого непонятного режима не показывает, чтобы какие то процессы использовали диск. Система debian 7, ядро стандартное 3.2, hdparam установлен и стартует с дефолтными настройками.

Подскажите, в чём может быть дело или хотя бы куда копать.

★★★★★
Ответ на: комментарий от Deathstalker

Предположительно, с охлаждением нет никакой проблемы. Тем более я хронически использую режим powersave.

На диске нет датчика температуры, я не могу сказать до скольки он греется. И даже если греется, непонятно как это может заставлять его издавать звук хаотичного обращения к данным.

kirill_rrr ★★★★★
() автор топика
Последнее исправление: kirill_rrr (всего исправлений: 1)

hdparm -i /dev/<твой диск> в студию.

Если это seagate ST{ЦИФРА}000DM001-9YN164 иди на сайт за прошивкой и шейся.

Jameson ★★★★★
()
Ответ на: комментарий от kirill_rrr

На диске нет датчика температуры

Так не бывает. На любом диске есть датчик, отдаётся через smart, нужен для термокалибровок. Стуки бывают в двух случаях: частые термокалибровки - нужно охлаждение, слишком частая парковка головок, в этом случае можно поиграть режимами энергосбережения с помощью hdparm. Иногда, как в случае вышеупомянутого сигейта и некоторых wd green это не помогает, ибо баг в прошивке или нестандартное управление энергосбережением. В случае сигейта - перепрошиваться, в случае wd green - тулзень есть, idle3ctl, достаточно запустить один раз, или каждый раз при загрузке hdparm -J 300 --please-destroy-my-drive /dev/sdX

Jameson ★★★★★
()
Ответ на: комментарий от Jameson
hdparm -i /dev/sda

/dev/sda:

 Model=TOSHIBA MQ01ABD100, FwRev=AX003J, SerialNo=93CDW0PBT
 Config={ Fixed }
 RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=0
 BuffType=unknown, BuffSize=8192kB, MaxMultSect=16, MultSect=16
 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=1953525168
 IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
 PIO modes:  pio0 pio1 pio2 pio3 pio4 
 DMA modes:  sdma0 sdma1 sdma2 mdma0 mdma1 mdma2 
 UDMA modes: udma0 udma1 udma2 udma3 udma4 *udma5 
 AdvancedPM=yes: unknown setting WriteCache=enabled
 Drive conforms to: Unspecified:  ATA/ATAPI-3,4,5,6,7

 * signifies the current active mode
kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

Это точно не парковка головок, smartctl подтвердил.

Что за термокалибровка? Как обратиться к её датчику? Разве она происходит при фрагментированном чтении/записи?

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от kirill_rrr

Тогда уж и hdparm -I сделай, до кучи. Насколько я знаю у твоего винта из неприятных особенностей есть только опасность (редкая, обычно при ударе в момент парковки) попадания головок под рампу при парковке из за особенностей механизма, с дальнейшей невозможностью стартовать, деформацией, отломом бошек и последующим запиливанием поверхности. Явно не твой случай. В остальном винт как винт.

Он ноутбучный, наверняка по дефолту паркуется часто, энергию бережёт. Поиграйся с соответсвующими параметрами hdparm.

Jameson ★★★★★
()
Ответ на: комментарий от Jameson
 hdparm -I /dev/sda

/dev/sda:

ATA device, with non-removable media
	Model Number:       TOSHIBA MQ01ABD100                      
	Serial Number:      93CDW0PBT
	Firmware Revision:  AX003J  
	Transport:          Serial, ATA8-AST, SATA 1.0a, SATA II Extensions, SATA Rev 2.5, SATA Rev 2.6, SATA Rev 3.0
Standards:
	Supported: 8 7 6 5 
	Likely used: 8
Configuration:
	Logical		max	current
	cylinders	16383	16383
	heads		16	16
	sectors/track	63	63
	--
	CHS current addressable sectors:   16514064
	LBA    user addressable sectors:  268435455
	LBA48  user addressable sectors: 1953525168
	Logical  Sector size:                   512 bytes
	Physical Sector size:                  4096 bytes
	Logical Sector-0 offset:                  0 bytes
	device size with M = 1024*1024:      953869 MBytes
	device size with M = 1000*1000:     1000204 MBytes (1000 GB)
	cache/buffer size  = 8192 KBytes
	Form Factor: 2.5 inch
	Nominal Media Rotation Rate: 5400
Capabilities:
	LBA, IORDY(can be disabled)
	Queue depth: 32
	Standby timer values: spec'd by Standard, no device specific minimum
	R/W multiple sector transfer: Max = 16	Current = 16
	Advanced power management level: 254
	DMA: sdma0 sdma1 sdma2 mdma0 mdma1 mdma2 udma0 udma1 udma2 udma3 udma4 *udma5 
	     Cycle time: min=120ns recommended=120ns
	PIO: pio0 pio1 pio2 pio3 pio4 
	     Cycle time: no flow control=120ns  IORDY flow control=120ns
Commands/features:
	Enabled	Supported:
	   *	SMART feature set
	    	Security Mode feature set
	   *	Power Management feature set
	   *	Write cache
	   *	Look-ahead
	   *	Host Protected Area feature set
	   *	WRITE_BUFFER command
	   *	READ_BUFFER command
	   *	NOP cmd
	   *	DOWNLOAD_MICROCODE
	   *	Advanced Power Management feature set
	    	SET_MAX security extension
	   *	48-bit Address feature set
	   *	Device Configuration Overlay feature set
	   *	Mandatory FLUSH_CACHE
	   *	FLUSH_CACHE_EXT
	   *	SMART error logging
	   *	SMART self-test
	   *	General Purpose Logging feature set
	   *	WRITE_{DMA|MULTIPLE}_FUA_EXT
	   *	64-bit World wide name
	   *	IDLE_IMMEDIATE with UNLOAD
	   *	WRITE_UNCORRECTABLE_EXT command
	   *	{READ,WRITE}_DMA_EXT_GPL commands
	   *	Segmented DOWNLOAD_MICROCODE
	   *	Gen1 signaling speed (1.5Gb/s)
	   *	Gen2 signaling speed (3.0Gb/s)
	   *	Gen3 signaling speed (6.0Gb/s)
	   *	Native Command Queueing (NCQ)
	   *	Host-initiated interface power management
	   *	Phy event counters
	   *	Idle-Unload when NCQ is active
	   *	unknown 76[13]
	   *	unknown 76[14]
	   *	unknown 76[15]
	   *	DMA Setup Auto-Activate optimization
	    	Device-initiated interface power management
	   *	Software settings preservation
	   *	SMART Command Transport (SCT) feature set
	   *	SCT LBA Segment Access (AC2)
	   *	SCT Error Recovery Control (AC3)
	   *	SCT Features Control (AC4)
	   *	SCT Data Tables (AC5)
Security: 
	Master password revision code = 65534
		supported
	not	enabled
	not	locked
		frozen
	not	expired: security count
		supported: enhanced erase
	212min for SECURITY ERASE UNIT. 212min for ENHANCED SECURITY ERASE UNIT. 
Logical Unit WWN Device Identifier: 5000039504a84502
	NAA		: 5
	IEEE OUI	: 000039
	Unique ID	: 504a84502
Checksum: correct
kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

Разве диск может парковаться 5 минут подряд, больше 10 щелчков в секунду (не могу сосчитать, слишком быстро)?

Load_Cycle_Count вырос на 1, была перезагрузка.

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от kirill_rrr

Что за термокалибровка?

Блины и штанги при нагреве слегка «плывут». Чтобы не терять дорожки винты периодически самокалибруются, сверяясь в процессе с внутренним датчиком температуры.

Как обратиться к её датчику?

SMART Attribute: 194 Temperature_Celsius. По дефолту smartd показывает нормализованное значение, не raw, учти.

Разве она происходит при фрагментированном чтении/записи?

Происходит когда растёт число ошибок чтения с блина и меняются (растут или падают) показания датчика температуры. Винт в этот момент пощёлкивает.

Jameson ★★★★★
()
Ответ на: комментарий от kirill_rrr

Разве диск может парковаться 5 минут подряд

Гении из WD заставили свои _десктопные_ 3.5 диски парковаться каждые 8 секунд по умолчанию например, так что почему нет, лол.

Выложи как весь smart тоже, что я тут гадаю...

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

Происходит когда растёт число ошибок чтения с блина и меняются (растут или падают) показания датчика температуры. Винт в этот момент пощёлкивает.

Ошибок нет. Если это она, то слишком долгая или они следуют друг за другом непрерывно. Это возможно на живом диске?

Temperature_Celsius 0x0022 100 100 000 Old_age Always - 39 (Min/Max 17/50)

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

Но всё таки, если бы он переодически калибровался я бы и не заметил. Но тут непрерывно по 3-5 минут, иногда больше. Причём почти при нулевом i/o

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson
 smartctl -a /dev/sda
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     TOSHIBA MQ01ABD100
Serial Number:    93CDW0PBT
LU WWN Device Id: 5 000039 504a84502
Firmware Version: AX003J
User Capacity:    1 000 204 886 016 bytes [1,00 TB]
Sector Sizes:     512 bytes logical, 4096 bytes physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Thu May 22 06:30:57 2014 YEKT
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		(  120) seconds.
Offline data collection
capabilities: 			 (0x5b) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Suspend Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					No Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   2) minutes.
Extended self-test routine
recommended polling time: 	 ( 228) minutes.
SCT capabilities: 	       (0x003d)	SCT Status supported.
					SCT Error Recovery Control supported.
					SCT Feature Control supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   050    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   050    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0027   100   100   001    Pre-fail  Always       -       1751
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       3265
  5 Reallocated_Sector_Ct   0x0033   100   100   050    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   050    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   050    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       2071
 10 Spin_Retry_Count        0x0033   164   100   030    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       383
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       3
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       93
193 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       8071
194 Temperature_Celsius     0x0022   100   100   000    Old_age   Always       -       40 (Min/Max 17/50)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
220 Disk_Shift              0x0002   100   100   000    Old_age   Always       -       0
222 Loaded_Hours            0x0032   096   096   000    Old_age   Always       -       1811
223 Load_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
224 Load_Friction           0x0022   100   100   000    Old_age   Always       -       0
226 Load-in_Time            0x0026   100   100   000    Old_age   Always       -       259
240 Head_Flying_Hours       0x0001   100   100   001    Pre-fail  Offline      -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      2070         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay. 
kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

Проследил за температурой диска под нагрузкой, стабильно 40 при работе kvm (2-3 Мб/сек). При остановке kvm i/o падает до 0, звук сохраняется, температура растёт до 41. Температура процессора всё это время не превышает 38.

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

А существует тихий способ охлаждения винчестера в гарантийном ноутбуке, чтобы можно было проверить, связана ли проблема с перегревом, или присутствует при любой температуре?

kirill_rrr ★★★★★
() автор топика
Ответ на: комментарий от Jameson

В инете пишут что такие звуки для него нормальны. Возможно он в простое какие то оптимизации делает. IMHO забей... На смарт посматривай, dmesg читай, особо не парься.

Jameson ★★★★★
()
Ответ на: комментарий от kirill_rrr

А существует тихий способ охлаждения винчестера в гарантийном ноутбуке

Подставки есть специальные под ноут, с вентиляторами. Актуальная вещь кстати. Ещё помогает подложить ему под задницу что нибудь, чтобы он слегка к тебе наклонился и образовалась щель между днищем и столом. Стол он под собой сильно греет?

Jameson ★★★★★
()
Ответ на: комментарий от Jameson

У него выхлоп назад, подсос снизу. 2 вентилятора в задней половине, там же все заметные источники тепла (по крайней мере выхлопные радиаторы). 65 для проца - норма, верхняя панель аллюминевая, над радиатором легко греется до 40.

Так что стол не греет, но выхлоп сзади может быть 40+ градусов. И из за этой склонности к высоким температурам я почти всегда держу процессор в powersave, в таком состоянии он греется и греет не сильнее обычного нетбука с двухядерным атомом.

Где именно проц, батарея и винчестер не знаю.

kirill_rrr ★★★★★
() автор топика
Последнее исправление: kirill_rrr (всего исправлений: 1)
/sbin/hdparm -B 255 /dev/sdX
/sbin/hdparm -M 254 /dev/sdX
Umberto ★☆
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.