LINUX.ORG.RU

Виснет мать. Куда копать?

 , , , ,


0

1

Зависает материнка MSI 970-G46 с камнем FX8350, под питанием от какого корсара с приличным запасом по мощности.

Виснет без видимых причин, во время простой работы, даже когда комп в покое и работает чисто шлюзом. Думал жара или перегрев но прогрел камень до 89 цельсиев с помощью stress - работает.

В логах ничего вообще. Виснет по всей видимости на уровне биоса, потому как когда зависает фаны сразу же выходят на максимальные обороты (управляются биосом), а на матери горят индикаторы всех четырех фаз питания процессора.

Последний апгрейд был еще весной - поменялся камень и питальник. С тех пор проблема не было.

Что это может быть?

★★★★★

В логах ничего вообще.

Гуглишь netconsole, отслеживаешь. Большой шанс получить логи, которые иначе просто не сохранятся.

anonymous
()
Ответ на: комментарий от anonymous

У меня была мысль про что-то такое. Сейчас запущено xsensors - хотя бы датчики посмотрю когда зависнет. Спс. ща погуглю

Suntechnic ★★★★★
() автор топика

Попробуй отключить драйвер superio, который отвечают за мониторинг температур, вентиляторов и т.п. вещей на материнской плате. На некоторых платформах возникает racing condition когда ядро и биос лезут к датчикам одновременно.

Khnazile ★★★★★
()
Последнее исправление: Khnazile (всего исправлений: 1)
Ответ на: комментарий от darkenshvein

тоже ам3+, только гига. высокое io в ссд рейде не выдержала, по всей видимости

darkenshvein ★★★★★
()
Ответ на: комментарий от anonymous

Ссылку дать к сожалению не могу, я об этом читал в архивах списков рассылки на lm-sensors.org, но этот сайт мертв уже года два. А жаль, там было много полезной информации по датчикам и супериошкам.

Khnazile ★★★★★
()

MSI 970-G46 с камнем FX8350

Без разгона на этом огрызке, надеюсь?

но прогрел камень до 89 цельсиев с помощью stress - работает.

Радиатор VRM до скольки прогрелся?)

devl547 ★★★★★
()
Последнее исправление: devl547 (всего исправлений: 1)
Ответ на: комментарий от anonymous

А на оффтопике подобное бывает?

Да, недавно нарукожопили некоторые с материнками под AM4. Софт для мониторинга лез в неположенные регистры, плата висла.

anonymous
()

Что это может быть?

AMD.

В далеком 2010 собрал на свою голову амд-систему. Правда под оффтопик. Висла так же рандомно, хер что поймешь. Менял все-итог тот-же. Под пингвином иногда только ругань в консоль стреляла (что-то с северным мостом ей не нравилось, или южным-уже точно и не помню), но система жила. Тут вряд-ли что сделаешь, разве что производитель матплаты сделает чудо и обновит нормально БИОС.

anonymous
()

делаю ставку на стресс тест

Xwo
()

но прогрел камень до 89 цельсиев

При максимальной в 70 градусов %) По ходу ты свой пк ну типа того, ну типа рипнул.

BceM_IIpuBeT ★★☆☆☆
()

я бы начал с протирки контактов спиртом (память, видяха...) и щупанья радиаторов мостов (или даже профилактичской замены термопасты под ними). ну и да, какой возраст БП?

NiTr0 ★★★★★
()
Последнее исправление: NiTr0 (всего исправлений: 1)
Ответ на: комментарий от Khnazile

А можешь на web.archive.org поискать? Может, что и найдется...

yars068 ★★★★
()
Ответ на: комментарий от Khnazile

Попробуй отключить драйвер superio

Ммм... не уверен что я понимаю что это и как это сделать:

> lsmod | grep io
snd_usb_audio         184320  2
snd_usbmidi_lib        32768  1 snd_usb_audio
snd_hwdep              16384  2 snd_hda_codec,snd_usb_audio
snd_pcm               102400  5 snd_hda_intel,snd_hda_codec,snd_usb_audio,snd_hda_core,snd_hda_codec_hdmi
snd                    77824  38 snd_hda_intel,snd_hwdep,snd_seq,snd_hda_codec,snd_usb_audio,snd_timer,snd_rawmidi,snd_hda_codec_hdmi,snd_hda_codec_generic,snd_usbmidi_lib,snd_seq_device,snd_hda_codec_realtek,snd_pcm

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от devl547

Без разгона на этом огрызке, надеюсь?

Конечно.

Радиатор VRM до скольки прогрелся?)

Что это? Питание или мост? Не знаю как посмотреть. На мосту у меня еще вентелятор стоит мелкий, запитан параллельно с Fan2

http://joxi.net/nAy6LONhYeYb9r - здесь 1 это CPU, 2 это северный мост, 3 - хз

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от BceM_IIpuBeT

При максимальной в 70 градусов %) По ходу ты свой пк ну типа того, ну типа рипнул.

Хз. Так показывают сенсоры. Что там в реальности я не знаю, но сейчас с него пишу. Для рипнутово неплохо пашет.

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от NiTr0

я бы начал с протирки контактов спиртом (память, видяха...)

Сделал это с памятью. Кстати пока работает. uptime 3:25, но и до этого он вис пару раз в день всего.

и щупанья радиаторов мостов

Они уже много лет адски горячие.

ну и да, какой возраст БП?

2-3 месяца Corsariar CX550M

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от Khnazile

некоторых платформах возникает racing condition когда ядро и биос лезут к датчикам одновременно.

очень сомнительно, биос не какое-то устройство, он тоже выполняется на том же процессоре. А если это один из обработчиков в SMM режиме, то у него и приоритет весь.

dimon555 ★★★★★
()
Ответ на: комментарий от devl547

Мост - фигня, у меня уже много лет в собственном соку на m5a97 pro варится.

Товарищ намедни выкинул как раз m5a97 pro с глюками стораджа.

pekmop1024 ★★★★★
()
Ответ на: комментарий от dimon555

Согласен, что выглядит странно, но тем не менее, я это не сам придумал, а взял подчерпнул из обсуждений драйверов для работы с super io. У людей как раз были «загадочные» проблемы с перезагрузками и зависаниями, которые решались отключением опроса датчиков. К сожалению, по таким вещам сейчас нет почти никакой внятной документации. На супериошку в своей материнской плате я даже распиновку выводов в открытом доступе не нашел.

Khnazile ★★★★★
()
Ответ на: комментарий от Suntechnic

покажи выхлоп sensors, по нему можно сказать, какой драйвер используется.

Khnazile ★★★★★
()

Хочешь проверить мать? Возьми другой БП, 100% рабочий, подключи одну только мать и грузани на ней какой-нибудь sysresccd с memtest+-ом в цикле. Если пару суток проработает без зависона, то мать скорее всего впоряде. Дальше уже только нагрузочное тестирование. Можно проц нагрузить в том же sysresccd. И так же пару суток.

anonymous
()

1. Скорее всего память. Понизь частоту.

2. Бывают еще глюки от включенного IOMMU.

3. Биос попробуй обновить.

soomrack ★★★★★
()

выбрасывай память

SevikL ★★★★★
()

Это у тебя проблемы с обучаемостью. Этож надо было одну глючную тормозную кукурузину сайдгрейднуть на другую. В этот раз постарайся сделать вывод.

anonymous
()

Было нечто похожее, только на Intel. Упарился искать, почему машина виснет без причин. Memtest ничего не дал. В конечном итоге запустил stress test GPU. Оказалась видяха. Гонял вот этим http://www.ultimatebootcd.com/download.html

SergeySVold ★★★★★
()
Ответ на: комментарий от Suntechnic

На матери? Вроде да, но осмотрю получше.

Везде. И в БП заглянуть не плохо бы. И на видюхе, если есть.

Сколько планок памяти и какие? Может с одной попробовать в разных слотах?

samson ★★
()

Вставить заведомо исправный проц и память, погреть мосты, не поможет - на помойку, она ж копеечная.

al-kascheni
()
Ответ на: комментарий от soomrack

2. Бывают еще глюки от включенного IOMMU.

На некоторых материнках - наоборот от выключенного. Попробовать включить-выключить.

Suigintou ★★★★★
()
Ответ на: комментарий от Suigintou

Два последних раза когда я включал IOMMU кончились тем что система не грузилась, при чем и после отключения: IOMMU убивает диск

Впрочем эти настройки я давно не менял.

Suntechnic ★★★★★
() автор топика

Вообще все спасибо за участие, но проблема пока перестала проявляться. За последние сутки ни разу не глюкануло (я был в отъезде, так что «за последние сутки» это с моего последнего сообщения).

Suntechnic ★★★★★
() автор топика

Не знаю как процессоры AMD, а видеокарты AMD (бывш. ATi) выходят на максимальные обороты кулера в том случае, если отключилось доп. питание. Если это применимо к процессорам - значит проблема в блоке питания.

Кстати, FX8350 неплохо так майнят.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от ZenitharChampion

Если это применимо к процессорам - значит проблема в блоке питания.

Блок новый, DC-DC и с нихилым запасом по мощи.

Кстати, FX8350 неплохо так майнят

Что значит майнить применительно к процессору?

Suntechnic ★★★★★
() автор топика
Ответ на: комментарий от Suntechnic

Некоторые крипты подпадают под два условия: а). Имеют не нулевую стоимость б). Имеют алгоритм майнинга, наиболее подходящий для CPU, а не GPU.

ZenitharChampion ★★★★★
()
Ответ на: комментарий от Suntechnic

Например Monero (аббревиатура XMR). На этом процессоре выдаёт 400 хэшей в секунду, это одна или две тысячи рублей в месяц, если майнить в режиме 24/7. Разгон с 4.0 ГГц до 4.6 ГГц не даёт существенного прироста производительности майнинга.

Майнер брать здесь: https://ru.minergate.com/altminers/cpuminer-multi-wolf Параметры сборки:

CFLAGS="-march=barcelona -mfpmath=sse -O2 -msse2 -msse3 -mssse3 -maes -mavx" ./configure --prefix=/usr

Брал отсюда. Что лучше, -O2 или -O3? В данном конкретном случае - -O2, с ним производительность немного выше.

При запуске нужно указать URL, логин и пароль. Как это сделать, подскажет запуск с параметром --help. По первой приведённой мной ссылке есть пример команды.

Выбор пула совместной генерации. Во всяких разных рейтингах ругают Minergate (ссылку на который я привёл). А мне нравится. Тем не менее, список других пулов есть в интернете.

И ещё: майнер пишет при запуске, что с правами root его производительность выше. Есть ли там троян, я не знаю, не смотрел исходники. Но на всякий случай запускаю его из LiveCD.

ZenitharChampion ★★★★★
()
Последнее исправление: ZenitharChampion (всего исправлений: 3)
Ответ на: комментарий от ZenitharChampion

Спасибо. Это действительно то что нужно - обязательно поробую. Даже 500р. в месяц более чем достаточно ;)

Что лучше, -O2 или -O3? В данном конкретном случае - -O2

Это странно, но в любом случае никогда не удавалось ничего собрать с o3 - даже не знаю почему.

Suntechnic ★★★★★
() автор топика
Последнее исправление: Suntechnic (всего исправлений: 1)
Ответ на: комментарий от Suigintou

Попробуй с включенным IOMMU загрузить ядро с опциями iommu=pt iommu=1

tamo
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.