LINUX.ORG.RU
решено ФорумAdmin

Зависает Debian после dhcp renew

 ,


2

0

Приветствую.

Столкнулся с непонятной проблемой на сервере, зависания без какой либо закономерности, то раз в три месяца, то пару раз в день.
В логе, последнее что было перед каждым зависанием:

Sep 24 11:47:47 hserver dnsmasq[1270]: using nameserver XXX.XXX.XXX.XXX#53
Sep 24 11:47:47 hserver dnsmasq[1270]: using nameserver XXX.XXX.XXX.XXX#53
Sep 24 11:47:47 hserver dhclient[947]: bound to XXX.XXX.XXX.XXX -- renewal in 284 seconds.

недавно настроил watchdog, теперь сервер перезагружается после зависания, но всё так же нет закономерности, периодичность и нагрузка разные.

сервер на debian stretch 9.11, ядро 4.9.0-11-amd64.
на 4.9.0-9-amd64 проблема тоже была.
сервер настраивали примерно полгода назад, первое зависание было спустя три месяца.

в чем вопрос-то?
если в причине, то телепаты в отпуске.
если в диагностике... то руками не пробовал пнуть обновление адреса?

mos ★★☆☆☆
()
Ответ на: комментарий от mos

обновление адреса происходит без проблем.
зависания происходят рандомно.
через день или неделю. обновлений за это время тоже разное количество.
я к тому что по всем логам, последняя запись перед зависанием связана с dhcp.
я нашел на другом форуме тему, где дебиан зависает при запуске на такой же строке, но там решение не нашли.

M_Corvinus
() автор топика

Настраивай мониторинг ресурсов(ЦП, оперативка) и датчиков(температура). Снимай crash dump(если он есть, sysctl kernel.panic у тебя же не равен 0, правда?).

Ну и традиционно - все BIOS-ы(как материнки, так и контроллеров RAID, если таковые имеются) и iLO/IPMI - обновить до последней версии.

Pinkbyte ★★★★★
()
Ответ на: комментарий от M_Corvinus

я к тому что по всем логам, последняя запись перед зависанием связана с dhcp.

я понял, но может при ручном тыканьи удастся что-то заметить.

ну а так да, только мониторинг, если ничего в голову не приходит.

mos ★★☆☆☆
()
Ответ на: комментарий от Pinkbyte

сервер настраивал не я.
я им недавно занимаюсь, да и то так между прочим(компания маленькая, экономят), вот пару дней назад впервые за месяц проблема вылезла.
по логам посмотрел, что были подобные записи еще пару раз до меня.

вот тема с зависанием при запуске, на такой же строке
https://unix.stackexchange.com/questions/115167/why-does-debian-hang-after-dhcp

думал может кто сталкивался.
спасибо. буду пробовать.

M_Corvinus
() автор топика
Ответ на: комментарий от i3wm
# This file describes the network interfaces available on your system
# and how to activate them. For more information, see interfaces(5).

source /etc/network/interfaces.d/*

# The loopback network interface
auto lo
iface lo inet loopback

# The primary network interface

auto lan1
iface lan1 inet manual

auto localnet
iface localnet inet static
      address 192.168.141.1
      netmask 255.255.255.0
      bridge_ports lan1
      bridge_stp off
      bridge_waitport 0
      bridge_fd 0

auto localnet:0
iface localnet:0 inet static
      address 192.168.5.1
      netmask 255.255.255.0

auto wan1
iface wan1 inet dhcp

auto wan2
iface wan2 inet static
      address XXX.XXX.XXX.XXX
      netmask 255.255.255.252
      #gateway XXX.XXX.XXX.XXX

интерфейсы через udev переименованы, насколько я понял
bridge создан для виртуалки

M_Corvinus
() автор топика

Что за сетевые карты в сервере?

У тебя там несколько сетевых карт. По сети не пробовал подключиться?

Если при зависании текстовая консоль ни на что не реагирует - это явно аппаратная проблема. Проблема в том, что реальную текстовую консоль сейчас трудно встретить.

Ядро нельзя проапгрейдить на что-то более современное (4.14+)

vel ★★★★★
()
Ответ на: комментарий от vel

В том то и дело, что он не отвечает ни по сети ни в консоли.
Сейчас прописал ему айпишник вручную, он все равно статический и поставил crash dump. Kernel.panic не 0, но он не помогает и встроенный в материнку watchdog не всегда срабатывает.
Но теперь мне тоже кажется, что проблема аппаратная, сервак оказывается уже шесть лет 24/7 работает, меняли только жёсткие диски и бп. А комп то обычный, не сервер, хоть и на дорогих комплектующих.
Спасибо всем. Буду проверять дальше.

M_Corvinus
() автор топика
Ответ на: комментарий от M_Corvinus

сервак оказывается уже шесть лет 24/7 работает, меняли только жёсткие диски и бп. А комп то обычный, не сервер, хоть и на дорогих комплектующих.

сейчас выясниться ещё, что «сервак» стоит не в серверной, а в общедоступном помещении... а дальше крайности: либо его никогда не чистили от пыли, либо кто-то об него время от времени спотыкается... ну, а dhcp конечно, виноват

anonymous
()
Ответ на: комментарий от anonymous

сейчас выясниться ещё, что «сервак» стоит не в серверной, а в общедоступном помещении...

Подержу, надо смотреть что происходит на месте. Проходил давно вариант когда «сервер» это железка в помещении где народ в футбол от скуки гонял, и фигак мячем по «серваку», тот упал на бок, подняли и продолжили. Ну или полегче, кто-то на стуле переедет кабель и так далее.

anc ★★★★★
()
Ответ на: комментарий от anc

Он как раз стоит в отдельной импровизированной комнатке и его регулярно чистили. На чем не сэкономили так это на корпусе, там дофига фильтров и вентиляторов. Я его когда открыл ни пылинки не увидел. На проце mx-4 намазана и башня стоит, я температуры выше 60ти не видел на нем.
До того как на нем переустановили систему полгода назад, он три года работал без единого глюка, на оси 2016года.
Да и после проработал 4 месяца без перезагрузок. Судя по логам завис он первый раз пару месяцев назад. После этого проблема участилась, и в логах всегда последняя запись была от dhclient'а.
Будем считать, что тема закрыта, dhcp я исключил, прописав айпишник вручную. Он после этого завис еще три раза.
Самое интересное, что я грешил на блок питания, а в итоге когда установил внешнюю видеокарту(была только интегрированная), чтобы создать нагрузку, он перестал зависать. Дальше буду разбираться по мере появления проблемы. Всем спасибо.

M_Corvinus
() автор топика
Ответ на: комментарий от M_Corvinus

в итоге когда установил внешнюю видеокарту(была только интегрированная), чтобы создать нагрузку, он перестал зависать

У Вашей проблемы механические или электрические «корни».

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.