LINUX.ORG.RU

[не боян] самовольное выключение


0

0

товарищи! братья и сестры! я не знаю как еще обратиться, но у меня тут капец, нужна помощь. рядом висит топик похожий по смыслу, но нифига не баян, ибо у меня есть симптомы и я сначала пошевелился, прежде чем писать сюда.

в общем, при нагрузке комп вырубается (как выдернули питание). происходит это только под gcc. я и раньше знал, что gcc — хорошая проверка железа. но раньше (много лет назад) это были signal 11 в случайных местах и я менял память. а не то, что сейчас.

симптомы такие: сидеть, читать интернеты можно хоть сутками. но стоит только запустить пересборку софта и через 30-40 минут комп вырубится. компу более двух лет. ничего принципиального не менялось.

первое, что приходит в голову — блок питания. но здесь это Thermaltake Toughpower 1000W. так что о нехватке мощности не может быть и речи. сделано в корее, так что, хоть и не разбирал, там все должно быть хорошо с кондерами или что-там-вспухает.

второе — перегрев. процессор — core 2 duo E6850 (3 ГГц). обычно под нагрузкой 57 градусов показывает. материнка — Asus Striker — 40 - 41 градус (для них это холодно). корпус тоже thermaltake, все продувется, два месяца назад вычистил двухлетнюю пыль (глюки начались неделю назад).

попробовал прогнать memtest — что под живой системой, что под rescue диском, все было хорошо. не знал, чем можно нагрузить хорошо отдельно процессор — прогнал 4 часа prime95 под виндой. процессор разогрелся до 60 градусов, винда показывала 95% памяти занято, но никто не выключился. перегрузился назад — 30 минут сборки gettext с зависимостями и комп вырубился.

то есть отдельно процессор и память работают без вопросов.

gcc еще хорошо шуршит винтами. система тут стоит на встроенном в nVidia 680 SLI рейд-контроллере (RAID0 на двух WD Raptor'ах 37G + обычный WD на 500G). прогнал smartcl -t long на каждом из винов, входящих в массив — все хорошо, никаких ошибок. сейчас, допишу эти строки — попробую dd if=/dev/ar0 of=/dev/null. хотя как может сдохнуть рейд-контроллер — оно же встроенное! если сдохнет, то сразу все.

короче, нет идей больше. что делать?

★★★★

А в правилах русского языка ты ниасилил заглавные буквы, да?

Греться еще может чипсет (один из мостов). Блок питания может просаживаться по какой-либо причине при увеличении нагрузки на него.

Zhbert ★★★★★
()

если перегружается тупо без кернел паников то однозначно - железо

hizel ★★★★★
()

А, да, покажи логи, мб у тебя не аппаратная проблема, а при работе гцц происходит программный сбой.

Zhbert ★★★★★
()
Ответ на: комментарий от Zhbert

правила русского языка потеряли надо мной силу в 98 году, когда я закончил школу. примерно тогда же я привык к IRC. так что не надо про маленькие буквы в начале предложений. логи могу показать, но что именно. я ж говорю — сбой как аппаратный.

moot ★★★★
() автор топика

сделал sudo dd if=/dev/ar0 of=/dev/null — все хорошо. у меня правда нет идей. что делать?

moot ★★★★
() автор топика
Ответ на: комментарий от vostrik

у меня сейчас нет знакомых, чтоб протестить чужое железо. да и на что попробовать заменить килловатный блок питания, сделанный не в китае?..

видео стоит 8800 GTS от XFX. на нем всегда 60 градусов, хотя при чем тут оно...

moot ★★★★
() автор топика

А там только 3 вещи, это блок питания, память и жесткий диск. Если не одно из этого то я в таком случае выкидываю материнку с процем и покупаю новую.

qsloqs ★★
()
Ответ на: комментарий от qsloqs

та хрен бы уже с этой материнкой. я уже не помню, сколько за нее заплатил. хотя денег у меня как раз сейчас нет. придется перейти на бинарные обновления без gcc некотрое время.

знать бы кто именно сдох. походу, похоже, материнка.

moot ★★★★
() автор топика
Ответ на: комментарий от vostrik

> думаю, киловаттный блок не нужен. для проверки достаточно просто исправного обычного.

ну вот совсем не у кого взять. а купить просто так не могу.

moot ★★★★
() автор топика

Попробуйте на всякий случай загрузится с параметром ядра acpi=off вдруг какой глюк с этим. Также попробуйте использовать какую-нибудь другую версию ядра, попробуйте самое новое, 34е. Хотя если раньше работало и ничего не обновлялось в последнее время - помочь не должно.

Да, лично я бы на бренд блока питания всё равно полагаться не стал бы. В то же время, если винда работает, наверное дело не в нём.

Nixopatolog
()
Ответ на: комментарий от moot

Если совсем денег нет то я думаю блок питания вольтиметром можно проверить, память если две планки тестировать поочередно, и без жесткого диска LiveCD какойнить погоняй, и покомпилируй там.

qsloqs ★★
()
Ответ на: комментарий от Nixopatolog

нет, к сожалению дело не в ядре. тут во-первых, freebsd, а во-вторых я предпочитаю сидеть на -RELEASE'ах, так что оно не менялось давно, не считая security-фиксов. попробовал на всякий случай загрузиться без acpi, так оно не увидело мой RAID0, где у меня ядро, /usr и тому подобное, кроме /home.

в 20:18 по киеву поставил все тот же gettext с зависимостями пересобираться, в 20:36 оно выключилось... до этого все это время читал сидел лор без проблем.

moot ★★★★
() автор топика
Ответ на: комментарий от qsloqs

> Если совсем денег нет то я думаю блок питания вольтиметром можно проверить, память если две планки тестировать поочередно, и без жесткого диска LiveCD какойнить погоняй, и покомпилируй там.

мультиметра нет, но это добыть можно. материнка вообще оверклокерская, хоть я этим еще не пользовался. то есть можно все настраивать. может попробовать завысить ей какое-нибудь напряжение?.. вдруг не хватает auto. я, правда, не знаю, что именно.

moot ★★★★
() автор топика
Ответ на: комментарий от CyberTribe

штатные средства фри показывают только температуру ядер (честно говоря, я не очень им доверяю):

ross@striker /home/ross pts/0> sysctl -a | grep temper
hw.acpi.thermal.tz0.temperature: 40.0C
dev.cpu.0.temperature: 34.0C
dev.cpu.1.temperature: 31.0C

это сейчас, idle. ну вырастают на пару градусов. говорю ж — гонял prime95 — все нормально. я пару месяцев назад поставил zalman CNPS9700NT и вычистил всю пыль. с охлаждением проблем нет.

moot ★★★★
() автор топика
Ответ на: комментарий от moot

до 47 дошло, прежде чем выключиться.

почитал свой тред — ну бред же. не может такого быть. не может же блок питания проседать только под gcc?..

moot ★★★★
() автор топика
Ответ на: комментарий от moot

[бред]А у вас никакого Watchdog таймера под freebsd не настроено? Может, GCC настолько уменьшает отзывчивость системы...[/бред]

Nixopatolog
()
Ответ на: комментарий от Nixopatolog

не настроено и я не знаю, как и что на эту тему настраивать... по ощущениям, отзывчивость не падает. cpubar'ы в коньках в районе 100% прыгают, память — процентов 30-50 от 2G (к ней я не присматривался особо).

всю ночь работал memtest с rescue disk'а. ошибок нет. поставил собираться ядро — выключилось.

ну ладно, подкоплю денег и буду по очереди менять компоненты. начну с блока питания. а на выходных попробую разобрать комп до винтика и снова собрать (вдруг что-то криво стоит)...

moot ★★★★
() автор топика
Ответ на: комментарий от moot

Блок питания может давать самые странные глюки. Еще глянь пухлые кондеры на материнке. И померяй температуру мостов.

sh_topor
()

moot

короче, нет идей больше. что делать?

Сколько памяти, размер свопа?

У меня похожие синдромы были с гигом памяти, правда под другой операционной системой, когда своп переполнялся.

vOrOn
()
Ответ на: комментарий от vOrOn

2 гига, своп тоже два гига. но в своп оно не лезло (у меня $membar и $swapbar в коньках).

и это, кстати, не банальные перебои с электричеством — тут UPS стоит...

в общем, как было не лень, разобрал вчера его полностью, разложил на столе, протер, продул, окропил святой водой^W^W^W процессор и все остальное. собрал. и все прошло. перекомпилял все, что только можно было (часа четыре-пять в общей сложности) — не выключился.

так что проблему можно считать решенной. всем спасибо за участие.

moot ★★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.