LINUX.ORG.RU
ФорумAdmin

Мотает хард, сообщения в консоль, система висит

 , ,


0

1

Хард, судя по лампочке мотает. Комп туповатый стал, иногда виснет чуть ли не наглухо, потом отпускает его.
Периодически вылезают сообщения в консоль, незавсимо от того, что в ней происходит:

err:ntdll:RtlpWaitForCriticalSection section 0x868798 "?" wait timed out in thread 0024, blocked by 0023, retrying (60 sec)
err:ntdll:RtlpWaitForCriticalSection section 0x868798 "?" wait timed out in thread 0024, blocked by 0023, retrying (60 sec)


или:
check update 1391598000 1391598600 600
chart aggregate chart_values_10min update point: 15:10:00-15:20:00
chart cleanup chart_values_raw
trans queue id: 7005 config, size: 28017



atop: [img]http://img.ii4.ru/thumbs/2014/02/05/462452_2.png[/img]


Только что такое упало:

check update 1391598600 1391599200 600
chart aggregate chart_values_10min update point: 15:20:00-15:30:00                                                                                
chart cleanup chart_values_raw                                                                                                                    
trans queue id: 7123 config, size: 24291                                                                                                          
RESOLVER: bad name to resolve:                                                                                                                    
RESOLVER: bad name to resolve:       


Есть подозрение на dude, запущенную в вайне.

lousx
() автор топика

err:ntdll:RtlpWaitForCriticalSection — это у вас Wine, а внутри него кто-то запущен и глючит. Может не иметь отношения к проблеме, но, наверное, стоит разобраться, откуда взялось.

LeninGad
()

err:ntdll:RtlpWaitForCriticalSection

А при чем тут wine?

no-such-file ★★★★★
()

На винфак.

anonymous
()
Ответ на: комментарий от anonymous

Почему-то спойлер в предпросмотре у меня не заработал, потому в таком виде:

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Barracuda 7200.10
Device Model:     ST380815AS
Serial Number:    5QZ6PAWM
Firmware Version: 4.AAB
User Capacity:    80 026 361 856 bytes [80,0 GB]
Sector Size:      512 bytes logical/physical
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Wed Feb  5 15:42:43 2014 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
See vendor-specific Attribute list for marginal Attributes.

General SMART Values:
Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                (  430) seconds.
Offline data collection
capabilities:                    (0x5b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   1) minutes.
Extended self-test routine
recommended polling time:        (  27) minutes.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   253   006    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0003   097   097   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       623
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   085   060   030    Pre-fail  Always       -       362077307
  9 Power_On_Hours          0x0032   068   068   000    Old_age   Always       -       28373
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       618
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   055   045   045    Old_age   Always   In_the_past 45 (Min/Max 42/46)
194 Temperature_Celsius     0x0022   045   055   000    Old_age   Always       -       45 (0 21 0 0)
195 Hardware_ECC_Recovered  0x001a   073   060   000    Old_age   Always       -       81739927
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 Data_Address_Mark_Errs  0x0032   100   253   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

lousx
() автор топика
Ответ на: комментарий от anonymous

Забыл сказать. После длительного просто висит особенно долго и упорно.

lousx
() автор топика
Ответ на: комментарий от darkenshvein

У меня открывается. Проверил. Спасибо, darkenshvein

lousx
() автор топика
Ответ на: комментарий от lousx
 7 Seek_Error_Rate         0x000f   085   060   030    Pre-fail  Always       -       362077307

Сделай low level format.

195 Hardware_ECC_Recovered  0x001a   073   060   000    Old_age   Always       -       81739927

А это решается заменой SATA шнурка и/или SATA порта на материнке. В худшем случае заменой харда или самой материнки.

Kroz ★★★★★
()
Ответ на: комментарий от lousx

Выкидываю хард.

28к часов наработано, небось пора на покой, только не выкидывай, ибо щас ssd всунешь вместо него, тот будет грозиться загнуться, а ты на крайний случай будешь с этого грузиться.

anonymous
()
Ответ на: комментарий от anonymous

Ни в коем случае ssd тыкать не стану. Да и к тому же под рукой только hdd. Попробую перенести на другой винт.

lousx
() автор топика
Ответ на: комментарий от lousx

С отрубленной дудой та же картина.

я не знаю что такое «дуда», но проблема в этой вашей ntdll, которая работает очевидно в вашей wine.

А виснуть оно может и из-за тысячи других причин, приложи хотя бы top -n1 из консоли по CTRL+ALT+F6. Или почитай логи, если виснет намертво и в консоль не входит.

emulek
()
Ответ на: комментарий от emulek

the dude
При не запущенном вайне система так же виснет.

Tasks: 212 total,   2 running, 209 sleeping,   0 stopped,   1 zombie
%Cpu(s):  4,3 us,  5,4 sy,  0,0 ni, 73,2 id, 16,6 wa,  0,0 hi,  0,5 si,  0,0 st
KiB Mem:   3921080 total,  3772672 used,   148408 free,  2440908 buffers
KiB Swap:  3212284 total,    13556 used,  3198728 free,   181060 cached

  PID USER      PR  NI  VIRT  RES  SHR S  %CPU %MEM    TIME+  COMMAND                                                                             
 5822 root      20   0  9860  564  448 R  43,0  0,0   5:44.19 dd                                                                                  
 3360 root      20   0  156m  41m  14m S   6,1  1,1   1:15.56 Xorg                                                                                
 5907 root      20   0     0    0    0 S   6,1  0,0   0:06.39 kworker/2:0                                                                         
 6086 lousx1    20   0 15112 1344 1004 R   6,1  0,0   0:00.01 top                                                                                 
    1 root      20   0 10648  632  596 S   0,0  0,0   0:00.73 init                                                                                
    2 root      20   0     0    0    0 S   0,0  0,0   0:00.00 kthreadd                                                                            
    3 root      20   0     0    0    0 S   0,0  0,0   0:00.10 ksoftirqd/0                                                                         
    6 root      rt   0     0    0    0 S   0,0  0,0   0:00.14 migration/0                                                                         
    7 root      rt   0     0    0    0 S   0,0  0,0   0:00.00 watchdog/0                                                                          
    8 root      rt   0     0    0    0 S   0,0  0,0   0:00.11 migration/1                                                                         
   10 root      20   0     0    0    0 S   0,0  0,0   0:00.09 ksoftirqd/1                                                                         
   12 root      rt   0     0    0    0 S   0,0  0,0   0:00.00 watchdog/1                
На данный момент в вайне ничего не запущено. Только после ребута. хард подрубал. Тормозов нет.

lousx
() автор топика
Ответ на: комментарий от emulek

Читал, что отказоустойчивость у них низкая. На сколько это правда, не знаю. Плюс дороговизна. У брата 2 ssd в raid0 стоят. Посмотрим...

lousx
() автор топика
Ответ на: комментарий от emulek

Я знаю как переводится dude. Запустил копирование с харда на хард. Ни капли тормозов нет.
Запускаю wine, ухожу курить, жду тормозов...

lousx
() автор топика
Ответ на: комментарий от lousx

Читал, что отказоустойчивость у них низкая.

4.2

На сколько это правда, не знаю

своя голова на плечах есть? Как может годами работать магазин, который даёт 5 лет гарантии на говно, которое постоянно ломается?

Плюс дороговизна.

4.2

У брата 2 ssd

надеюсь у старшего...

emulek
()
Ответ на: комментарий от emulek

своя голова на плечах есть? Как может годами работать магазин, который даёт 5 лет гарантии на говно, которое постоянно ломается?

Как и все остальные магазины при капиталистическом строе, дающие гарантию. Если даже будет 20% возврата, то они, скорее всего, все равно останутся в прибыли, если взглянуть на себестоимость смартфона и цену в магазине. (сравнил хрен с пальцем, но картина, думаю, та же) Но речь то не об этом...

надеюсь у старшего...

Именно!

lousx
() автор топика
Ответ на: комментарий от emulek

видишь? А я не знал. Теперь подумай о ЦА данного ПО.

Тогда к чему ссылка на транслэйт.гугл?
Ранее стояла дуда, проблем не наблюдал. Я не первый, кто ей пользовался и пользуюсь в винде. На офф сайте есть мана по запуску в вайне.

lousx
() автор топика
Ответ на: комментарий от lousx

Ну так чо там после перекура? Тормозит? Мож проблема в вайне, а не в диске? atop запусти во время тормозов

anonymous
()
Ответ на: комментарий от Kroz

low level format на современных винтах означает немедленный трансфер оного на помойку. И для сигейтов большое значение ошибок позиционирования в SMART - в порядке вещей.
А вот насчет 195 Hardware_ECC_Recovered - тут да, дело нечистое.

whoami
()
Ответ на: комментарий от lousx

А что это за процесс dd в топе, который уже сожрал почти 6 минут времени ЦПУ? Судя по iowait он-то как раз и насилует хард

whoami
()
Ответ на: комментарий от anonymous

Толком не курил. Пока без тормозов. Обед c 13-00 lj 14-00 будет хорошей паузой. Где-то грешили на хранители экранов - все поотрубал. Не помогло. И еще... Вспоминается как после ночного простоя дуда лежала с ошибкой и комп основательно висел. Только вот atop не посмотрел, срочно херил дуду и комп постепенно отпускало.

lousx
() автор топика
Ответ на: комментарий от whoami

Чуть выше писал, что сливаю образ харда.

lousx
() автор топика
Ответ на: комментарий от whoami

low level format на современных винтах означает немедленный трансфер оного на помойку.

Я только что запорол 500 гиговый хард, пол года ждавший меня в заначке?

lousx
() автор топика
Ответ на: комментарий от lousx

шо за дуда, ведущая на сайт микротика? вантузятина какая-то? от вайна действительно бывают лютые тормоза с зависонами

anonymous
()
Ответ на: комментарий от lousx

А что вы подразумеваете под low level format?
Забитие харда нулями через dd или ERASE в MHDD- это не low level format.

whoami
()
Ответ на: комментарий от anonymous

шо за дуда, ведущая на сайт микротика? вантузятина какая-то?

Микротиковская вантузятина для мониторинга сетки. Если ткнете мордой в линуховый аналог - расцелую!

lousx
() автор топика
Ответ на: комментарий от lousx

Как и все остальные магазины при капиталистическом строе, дающие гарантию. Если даже будет 20% возврата, то они, скорее всего, все равно останутся в прибыли, если взглянуть на себестоимость смартфона и цену в магазине. (сравнил хрен с пальцем, но картина, думаю, та же)

при чём тут смартфоны? Ты ещё про наркотики расскажи.

Но речь то не об этом...

речь именно об этом, ты сам сказал, что вероятность выхода из строя девайса менее 20% за 5 лет. Теперь обдумай, какова эта вероятность для HDD. Ведь мы их сравниваем. И ты поймёшь, что если-бы SSD имели-бы более низкую MTBF, то магазин бы либо снизил-бы гарантийный срок, либо повысил накрутку. Но ни того, ни другого мы не наблюдаем. Откуда вывод: SSD такое же говно как HDD.

emulek
()
Ответ на: комментарий от emulek

Торгаш, что тебе неймётся в каждом треде ssd рекламировать? Иди на других сайтах свой дерьмо нахваливай.

anonymous
()
Ответ на: комментарий от anonymous

snmp+любая свободная могучая мониторилка

Например? Поставил заббикс. Но такого гемора с добавлением устройств я еще не видел. Да гибкая. Но попробуйте добавить несколько десятков устройств и нарисовать связи между ними. Для каждого типа железяки свой шаблон нужно создать. С ума можно сойти.

lousx
() автор топика
Ответ на: комментарий от lousx

opennms, zenoss. Оба умеют автодискавери и рисование карт. Правда в первом автодискавери меня раньше пугало, и я его не использую. zabbix — немощная мониторилка.

anonymous
()
Ответ на: комментарий от anonymous

Кланяюсь и благодарю. При встрече расцелую.
Какую из двух посоветуете? Каким образом можно настроить оповещение при отказе устройства?


Я тоже автодискавери боюсь. Ушел на обед. По приходу жду висяк.

lousx
() автор топика
Ответ на: комментарий от whoami

low level format на современных винтах означает немедленный трансфер оного на помойку. И для сигейтов большое значение ошибок позиционирования в SMART - в порядке вещей.

Ну, если разве что если это особенность конкретных хардов.

Kroz ★★★★★
()
Ответ на: комментарий от lousx

Замена порта+шнурка не спасла. Выкидываю хард. Спасибо!

Эммм. Вставь другой хард, попробуй. Попробуй этот хард на другом компе.

Kroz ★★★★★
()
Ответ на: комментарий от anonymous

Торгаш, что тебе неймётся в каждом треде ssd рекламировать? Иди на других сайтах свой дерьмо нахваливай.

барыга как раз ты. Причём тупой барыга — накупил кучу HDD, а теперь понял, что они никому в|| не впились.

Страдай молча, или делай вдоль. Можешь подождать лет 50, тогда пойдёт как антиквариат (:

emulek
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.