LINUX.ORG.RU

Может ли система падать от софта?

 ,


0

1

На одном из компов начала пердичекски, раз в несколько дней падать система.
Намертво. Никакие Ctrl-Alt-Del не помогают. И это не kernel panic, что-то другое.
В логах перед падением полная благодать, никаких признаков, что собирается упасть.

Похоже на память, поэтому первым делом сменил ее. Не помогло.
Затем последовательно сменил: материнку, проц, и БП. По барабану.

Отсюда вопрос: может ли софт так намертво вешать систему? Прикладной может и нет, а например, дрова?

В винде понятно, там сразу блускрин и все такое. А в Линуксе непонятно, не сталкивался еще с таким.

PS. Корпус менять не стал, маловероятно :))



Последнее исправление: Red7 (всего исправлений: 1)

может ли софт так намертво вешать систему?

Прикладной может и нет, а например, дрова?

Маловероятно.

vvn_black ★★★★★
()
Ответ на: комментарий от Red7

пердичекски, раз в несколько дней падать

Если пердически, то похоже на железо.

Затем последовательно сменил: материнку, проц, и БП

Не видно в этом списке видюхи, или интеграшка?

vvn_black ★★★★★
()
Последнее исправление: vvn_black (всего исправлений: 1)
Ответ на: комментарий от Tanger

Если судить по мюнину, то памяти занято совсем немного, и этот показатель стабилен и не меняется до самого падения.

Не видно в этом списке видюхи, или интеграшка?

Ее попросту нет - ксеончик.

Red7
() автор топика

падать система.
Ctrl-Alt-Del не помогают.
не kernel panic

Написал бы хоть как это твоё «падать» выглядит.

ya-betmen ★★★★★
()

Запросто. На винде, если курсор мыши не двигается, это 99.99% железо, а на линуксе видел такое и софтовое, не скажу какой дистр, зы. другой дистр работал на том же железе.

ilovewindows ★★★★★
()

На одном из компов начала пердичекски, раз в несколько дней падать система

Вангую: что-то с железом.

В логах перед падением полная благодать, никаких признаков, что собирается упасть.

А что происходит в момент падения?

Похоже на память, поэтому первым делом сменил ее

Ещё бы мемтест прогнать.

fernandos ★★★
()
Ответ на: комментарий от ya-betmen

А что происходит в момент падения?
Написал бы хоть как это твоё «падать» выглядит.

Так я хоть и написал. В самом начале. Могу только добавить, что и сеть тоже отвалилась.

Вангую: что-то с железом.

С каким? Осталось только поменять ящик.

Ещё бы мемтест прогнать.

Целыми днями ним и ганял, и не только им - все чисто.

Запросто.

Это насчет чего?

Red7
() автор топика

А что за железо? А то в тех же intel braswell/Bay Trail современный линукс (примерно начиная с linux 5.x) Начал почти всегда в течение 30-60 мин. навертво виснуть. Даже аудиоплеер клинит. Ноутбук asus x540sa, говорят известный баг толи в линуксовом драйвере gpu i915, толи косяк в реализации turbo boost. Но чинить похоже никто не собрается.

gtk3 ★★★
()
Последнее исправление: gtk3 (всего исправлений: 1)

Отладку через COM порт подключить и посмотреть что происходит нельзя?

X512 ★★★★★
()
Ответ на: комментарий от Red7

Так я хоть и написал.

Ты ничего не написал.

Что на экране?

Можно ли переключиться на другой виртуальный терминал?

Как реагирует на капслоки и пр?

Ссх как я понял не фурычит ибо сети нет.

ya-betmen ★★★★★
()
Ответ на: комментарий от ya-betmen

Ты ничего не написал.
Что на экране?
Можно ли переключиться
Как реагирует на

Написал же по-русски, читай внимательно - ксеон, без видео!

Железо: сначала была интеловая материнка с i3, теперь gigabyte с xeon.

До com-порта и мэжик комбинации не добрался, потому что надо было быстро запускать, пнул reset и завелось по новой.
Да и нет на материнке com-порта.

Red7
() автор топика

Ты просто менял блок питания на такой же или ты вычислил сколько всему нужно ватт и обеспечил правильный БП?

vertexua ★★★★★
()
Ответ на: комментарий от vertexua

Оба БП с избытком, на 400 Вт. Весь ящик от сети потребляет всего 70-90 Вт.

Red7
() автор топика
Ответ на: комментарий от ya-betmen

Да вроде понятно написал -

Не видно в этом списке видюхи, или интеграшка?

> Ее попросту нет - ксеончик.

В-общем, нет видяхи ни в каком виде, ни в материнке, ни в проце.

Red7
() автор топика
Ответ на: комментарий от Red7

Видимо смутило что бсод без видео всё равно не увидеть.

В винде понятно, там сразу блускрин и все такое.

Прогони мемтест и если ничего не даст попробуй поставить мониторилку какую-нить, вдруг там кто-то начинает резко жрать память или что-то в этом духе. Кстати ты уверен что оно именно подвисло и не просто прекратило общение с переферией?

ya-betmen ★★★★★
()

Ядро насколько свежее? Где-то в 5.9 сломали что-то в подсистеме выделения/освобождения памяти в ядре, время от времени стало крашиться. Правда, в таком случае насрать в лог оно обычно успевает. Если система на EFI, есть ещё /sys/fs/pstore, куски логов могут падать туда (теоретически pstore не обязательно на efi, но в дебиане, например, по дефолту так).

alegz ★★★★
()
Ответ на: комментарий от alegz

Ядро несвежее - 4.19.0, в Дебиане за свежатиной не ганяются.
В /sys/fs/pstore пусто.

Прогони мемтест и если ничего не даст попробуй поставить мониторилку

Опять мне что ли, повторятся? :) Все это уже написал.
Хотя мониторинг памяти не ставил. Что в его качестве годится?

Кстати ты уверен что оно именно подвисло и не просто прекратило общение с переферией?

Вот тут точнее сказать не могу. Да, со всей периферией полный облом - клава, сеть, и даже кнопка Power, по которой при коротком нажатии система должна выключится, т.е. ACPI тоже отвалилась.

Red7
() автор топика

Да, cпокойно. В вашем случае это, возможно, плавающий баг. Какая это диагностировать, чтобы точно убедиться - отдельный большой вопрос. У меня такое бывало, когда намертво висли X в Linux Mint 17.3, после 10 минут работы… Совершенно случайно обнаружил, думал что у меня проблемы с железом, в частности с видеокартой проблемы.

nager
()
Ответ на: комментарий от gtk3

А то в тех же intel braswell/Bay Trail современный линукс (примерно начиная с linux 5.x) Начал почти всегда в течение 30-60 мин. навертво виснуть

Да ну что ты брешешь, раз в день зависает, не чаще.

tiinn ★★★★★
()
Ответ на: комментарий от ya-betmen

Кстати ты уверен что оно именно подвисло и не просто прекратило общение с переферией?

Плюсану данного товарища. Дело может быть в контроллере винта.

tiinn ★★★★★
()
Ответ на: комментарий от tiinn

А, ну да - забыл сказать, что и винт менялся.

Red7
() автор топика
Ответ на: комментарий от skyman

Процитирую себя:

Затем последовательно сменил: материнку, проц, и БП.

Ессно, все напряжения и температуры в норме на обеих материнках.

Red7
() автор топика
Ответ на: комментарий от peregrine

а должны? Мы вроде не на винфаке...

Это первая проверка - если система жива, то она должна перегрузится. Что тут не так?

Red7
() автор топика
Ответ на: комментарий от Red7

Не должна. Это Linux. SysRq + R, E, I, S, U, B единственно верный вариант, а что там на Ctrl-Alt-Del забинжено, это вообще никого не волнует. У меня вот ничего вообще не происходит по этому сочетанию кнопок.

peregrine ★★★★★
()

Не должна. Это Linux.

Еще как должна. Если, конечно, настроена. У меня настроена на Reboot, но можно и под шутдаун.

А вот если не ребутится - это верный признак, что с системой что-то не так.


Еще думаю - могут ли порты USB приводить к коллапсу?
У меня на них навешано с десяток диковинных устройств.
Конечно, все они исправные, ток потребления существенно меньше 0.5 А.

Но для каждого установлен свой специфический драйвер.
Может все-таки они, дровишки?

Red7
() автор топика
Последнее исправление: Red7 (всего исправлений: 2)

Отсюда вопрос: может ли софт так намертво вешать систему? Прикладной может и нет, а например, дрова?

Chromium может спокойно ушатать FreeBSD намертво, даже если ничего не делать.

iZEN ★★★★★
()
Ответ на: комментарий от fernandos

Ещё бы мемтест прогнать.

Что вам этот мемтест дался? Он лет 25 назад может что-то и показал бы. А сейчас вероятность этого стремится к нулю.

Sky_Falkorr
()
Ответ на: комментарий от Sky_Falkorr

Это самое простое и лёгкое, что можно сделать для тестирования оперативной памяти. Не покажет — дальше копать, покажет — вот и решение.

fernandos ★★★
()

Маловероятно что это память. Обычно проблема с памятью имеет не такие симптомы. Это могут быть бажный драйвер, питание(как бп так и материнка), процессор, какое-то устройство(dma вполне может ломать данные в памяти)

cobold ★★★★★
()

Ткну пальцем в нёбо и посоветую проверить с ядром посвежее из бэкпортов.

Korchevatel ★★★★★
()

Во-первых проверьте по логам - может что обновилось в системе на момент начала зависаний. Во-вторых, запустите на несколько дней любую live систему с максимально отличающимся ядром и набором драйверов

vaddd ★☆
()

ipmi есть? sol activate на упавшей что показывает?

pinus_nigra
()
Ответ на: комментарий от tiinn

Я своим глазам, слуху и логам доверяю больше чем неким «4-х звездным» форумным экспертам!

Да ну что ты брешешь, раз в день зависает, не чаще.

Раньше меня грабили каждый час, а теперь лишь раз в день. Так радуйся, холоп!

gtk3 ★★★
()
Ответ на: комментарий от gtk3

Я своим глазам, слуху и логам доверяю больше чем неким «4-х звездным» форумным экспертам!

У меня как раз был BayTrail J1800. Линукс Минт 17.2. Зависал раз в день, конкретно в FireFox - там жена онлайн видео смотрела. Без фокса не зависал вообще.

tiinn ★★★★★
()

Обычно перед зависанием система успевает насрать в логи. По умолчанию в дебиан journald persistent logs не настроен. Стоит настроить и посмотреть что выдаст.

einhander ★★★★★
()
Ответ на: комментарий от fernandos

На современных системах memtest ничего не ловит.

targitaj ★★★★★
()
Ответ на: комментарий от tiinn

Так у меня Braswell, а точнее Asus x540sa на pentium n3710. Не знаю на сколько они разные, но виснет. Или мои глаза врут!

gtk3 ★★★
()

Настройки отправку логов по сети на другую тачку. А то, может диск отваливается, вот и нету в логах ничего - просто записать не может, а до паники ты просто не ждешь истечения тайм-аутов, а ребутаешь.

slowpony ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.