LINUX.ORG.RU
ФорумAdmin

стабильно сбрасываются настройки сети почти в одно и тоже время

 


1

2

не могу понять почему и как исправить постоянный сброс сетевых настроек в 13:48-13:51(не точное время)

после сброса настроек восстанавливаю их следующими командами:

root@server4:/mnt/scripts# cat setip8.sh
#
ip addr add 192.168.1.8/24 dev enp5s0
ip route add default via 192.168.1.202 dev enp5s0
echo $(date) >> /mnt/scripts/setip8.log
ip addr add 192.168.1.8/24 dev enp5s0
ip link set enp5s0 up
но на след. день примерно в то же время +/-1.5мин происходит тоже самое, пропадает сеть

вот что в сислогах:

root@server4:/var/log# cat syslog
Oct  5 13:48:44 server4 kernel: [ 8555.865015] sky2 0000:05:00.0 enp5s0: Link is down
Oct  5 13:48:44 server4 NetworkManager[1123]: <info>  [1538736524.5224] device (enp5s0): link disconnected
....
Oct  6 13:48:41 server4 kernel: [94951.058160] sky2 0000:05:00.0 enp5s0: Link is down
Oct  6 13:48:41 server4 NetworkManager[1123]: <info>  [1538822921.2138] device (enp5s0): link disconnected
....
Oct  7 13:48:37 server4 kernel: [181346.268318] sky2 0000:05:00.0 enp5s0: Link is down
Oct  7 13:48:37 server4 NetworkManager[1123]: <info>  [1538909317.8967] device (enp5s0): link disconnected

пока я понятия не имею что происходит, - просто прописал в кроне этот скрипт выполняться каждую минуту с 13:45 до 14

но это не дело, все соединения в 13:52(+/-1мин) получается уже разорваны и юзерам и приложениям надо заново переподключаться (

нагуглил что это может из-за NetworkManager'а, - его я отключил

service NetworkManager stop но ничего не изменилось,

подскажите как можно исправить что бы сеть не пропадала?

инфо о системе:

root@server4:/var/log# uname -a
Linux server4 4.15.0-36-generic #39~16.04.1-Ubuntu SMP Tue Sep 25 08:59:23 UTC 2018 x86_64 x86_64 x86_64 GNU/Linux

root@server4:/var/log# uptime
 12:24:18 up 3 days, 58 min,  2 users,  load average: 0,02, 0,01, 0,00
сейчас там в основном самба и несколько виртуалок в виртуалбоксе

Ответ на: комментарий от vel
root@server4:/# lshw
server4
    описание: Настольный компьютер
    продукт: TS100-E6-PI4 (To Be Filled By O.E.M.)
    производитель: ASUSTek Computer INC.
    версия: 1.xxG
    разрядность: 64 bits
    возможности: smbios-2.6 dmi-2.6 vsyscall32
    конфигурация: boot=normal chassis=desktop family=To Be Filled By O.E.M. sku=To Be Filled By O.E.M. uuid=ECAC1007-83FE-D511-9EB0-736964716472
  *-core
       описание: Материнская плата
       продукт: P7F-X Series
       производитель: ASUSTek Computer INC.
       физический ID: 0
       версия: 1.xxG
       слот: To Be Filled By O.E.M.
     *-firmware
          описание: BIOS
          производитель: American Megatrends Inc.
          физический ID: 0
          версия: 0601
          date: 05/28/2010
          размер: 64KiB
          capacity: 1984KiB
          возможности: isa pci pnp apm upgrade shadowing escd cdboot bootselect socketedrom edd int13floppy1200 int13floppy720 int13floppy2880 int5printscreen int9keyboard int14serial int17printer int10video acpi usb ls120boot zipboot biosbootspecification
     *-cpu
          описание: ЦПУ
          продукт: Intel(R) Xeon(R) CPU           X3450  @ 2.67GHz
          производитель: Intel Corp.
          физический ID: 4
          сведения о шине: cpu@0
          версия: Intel(R) Xeon(R) CPU X3450 @ 2.67GHz
          серийный №: To Be Filled By O.E.M.
          слот: LGA1156
          размер: 1263MHz
          capacity: 3800MHz
          разрядность: 64 bits
          частота: 133MHz
          возможности: x86-64 fpu fpu_exception wp vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush dts acpi mmx fxsr sse sse2 ss ht tm pbe syscall nx rdtscp constant_tsc arch_perfmon pebs bts rep_good nopl xtopology nonstop_tsc cpuid aperfmperf pni dtes64 monitor ds_cpl vmx smx est tm2 ssse3 cx16 xtpr pdcm sse4_1 sse4_2 popcnt lahf_lm pti ssbd ibrs ibpb stibp tpr_shadow vnmi flexpriority ept vpid dtherm ida flush_l1d cpufreq
          конфигурация: cores=4 enabledcores=4 threads=8
...

думаешь дело в железе??

bobjamesbob
() автор топика
Ответ на: комментарий от bobjamesbob

Не исключено. Вздувшиеся/потекшие/высохшие конденсаторы.

С другой стороны - а в это время не происходит какой-нибудь высокой нагрузки? Есть хоть какой-нибудь мониторинг ?

А как сервер подключен к сети? Сколько лет оборудованию?

vel ★★★★★
()

Когда-то давно, когда Яндекс хостился в каком-то институте, его сервера падали на 15 минут каждый день. Ребята долго думали, в чём дело. Оказалось - уборщица в это время пила чай, и чтобы включить чайник, выдёргивала стойку из розетки.

Я это к чему - смотри в сторону внешних факторов и тому подобного.

Dispetcher14 ★★★★★
()
Ответ на: комментарий от Dispetcher14

нет, тут именно настройки сбиваются, если вытащить и вставить кабель все будет нормально и сеть будет работать

а тут получается что у интерфейса enp5s0 пропадает заданный ip и основной шлюз по умолчанию и вообще адаптер отключается и пока не запустишь:

ip addr add 192.168.1.8/24 dev enp5s0
ip route add default via 192.168.1.202 dev enp5s0
ip link set enp5s0 up
сам он не заработает.

а кондерики на мамке сухие, такие не вспучиваются тут что то другое, другие - соседние сервера работают нормально, от нагрузки вроде не зависит, т.к. даже на выходных, когда юзеров нет, всеравно происходит тоже самое

bobjamesbob
() автор топика

Чувак, тебя не смущает, что ты ВРУЧНУЮ прописывает сетевые настройки?

Итак, у тебя убунта. Настрой через network manager. Либо, если сильно не любишь его, через /etc/network/interfaces

Ставлю на то, что ты тупо не знаешь про dhcp

ок, с dhcp я не угадал, причина в падении линка. но всё равно тебе нужно настроить сеть, а не назначать сетевые настройки вручную

router ★★★★★
()
Последнее исправление: router (всего исправлений: 1)
Ответ на: комментарий от router

А раз линк падает каждый день в одно и тоже время, смотри куда он подключен. Может в это время секретарша выключает из розетки свич, чтобы включить микроволновку

Но, как уже говорил, твоя проблема из-за того, что ты не умеешь настроить сеть на убунте

router ★★★★★
()
Ответ на: комментарий от Dispetcher14

Аналогичный давний пример. Мелкий объект, сервер просто тупой десктоп, местные «написали бумажку» «уходя выключайте все из розеток» тоже не сразу народ сообразил почему сервак на ночь падает. :)

anc ★★★★★
()
Ответ на: комментарий от anc

Но если лог ТС не подправил, то в самом логе точность +- десяток секунд. Это поразительная точность для «уходя выключайте свет», особенно в обед и не круглое время. Что самое смешное, что для такой точности и такого времени если точно каждый день, то в чём проблема побыть 5 минут у сервера для детектирования проблемы?

vodz ★★★★★
()
Ответ на: комментарий от vodz

"пальцем в <s>потолок</s> небо"

где-там далеко-далёко стоит «роутер» на котором крутится «сервис dhcp»... И ровно в полночь карета превращается в тыкву час Х обновляются «аренды», вот только «Золушка так не умеет» (интерфейс почему падает и не поднимается)

end_vanga_mod

anymouze ★★
()
Ответ на: комментарий от router

этот файл уже давно не меняли

root@server4:/etc/network# cat /etc/network/interfaces
# interfaces(5) file used by ifup(8) and ifdown(8)
auto lo
iface lo inet loopback


iface enp5s0 inet static
address 192.168.1.8
netmask 255.255.255.0
gateway 192.168.1.202

root@server4:/etc/network# ls -l
итого 24
drwxr-xr-x 2 root root 4096 авг 22 06:20 if-down.d
drwxr-xr-x 2 root root 4096 авг 22 06:20 if-post-down.d
drwxr-xr-x 2 root root 4096 авг 22 06:20 if-pre-up.d
drwxr-xr-x 2 root root 4096 авг 22 06:20 if-up.d
-rw-r--r-- 1 root root  174 июл  2 14:04 interfaces
drwxr-xr-x 2 root root 4096 янв 24  2016 interfaces.d

а сеть пропадает в одно и тоже время уже давно (наверно больше месяца)

bobjamesbob
() автор топика
Ответ на: комментарий от vodz

прям рядом с ним стоял в момент Х, и свитчи и роутеры и все индикаторы мигают в штатном режиме, хз в чем дело, вчера тоже самое, сегодня думаю ничего не изменится..

лучше подскажите как или чем промониторить сервак в этот момент?

bobjamesbob
() автор топика
Ответ на: комментарий от bobjamesbob

Эксперименты — они такое: долго и нудно и в зависимости от предыдущих результатов количество типов экспериментов сразу не напишешь: менять порт коммутатора, ставить анализатор пакетов, желательно внешний или на зеркало порта или на хаб, если откопаете. Смотреть процессы и нагрузку...

vodz ★★★★★
()
Последнее исправление: vodz (всего исправлений: 1)
Ответ на: комментарий от vodz

Гадать можно долго, например стоит какая-нибудь неведомая хрень с таймером которая при старте дает в силовую сеть хз что, от чего тот же свитч уходит в ребут.

anc ★★★★★
()
Ответ на: комментарий от bobjamesbob

А по крону/ат ничего в этот момент не запускается ли?

anc ★★★★★
()
Ответ на: комментарий от vodz

И как ушедший в ребут свитч сбросит адреса у интерфейса?

Мы же видим «Link is down» а вот тот факт что система сбрасывает настройки при этом это совсем другой вопрос.

anc ★★★★★
()
Ответ на: комментарий от anc

два чая. но это мы видим. а они смотрят на свидетельство физических ограничений и лезут в логику. не стоит мешать им.

anonymous
()
Ответ на: комментарий от anc

Мы же видим «Link is down» а вот тот факт что система сбрасывает настройки при этом это совсем другой вопрос.

Видим. Потому и вопрос задаём, с какого рожна, пусть и при таких странных ручных настройках поднятия интерфейса, так происходит. Если вы видите в этом причину, так поделитесь своими знаниями. ТС же отключил NM. Я вообще уже ничего не понимаю. Вопрос — типичный «подземынй стук». А искать не хотят. Ну в чём трудность вручную взять и вырубить свитч?

vodz ★★★★★
()
Ответ на: комментарий от bobjamesbob

главное же что

интерфейс почему-то падает и не поднимается

в том же network manager для проводных подключений по-умолчанию прописан «автоподъём»

(про «аренды» — не смог «выкинуть слова из песни»; да и «точное» отключение сбивает с толку)

anymouze ★★
()
Ответ на: комментарий от anc

спасибо. перечитал по-внимательней...

Имеем: интерфейс не поднимается автоматически. (теперь) я полагаю, что причина программная и она в ПО (или настройках) этого сервера. После «ручной» установки поднимается же.

anymouze ★★
()
Ответ на: комментарий от bobjamesbob

догадки

Продолжаем гадать. В других логах (daemon.log, auth.log, ...) в эти «роковые минуты» нет каких-либо повторяющихся сообщений (каждый день)? А в том логе, что пишет Ваш скрипт — тоже всё «скучно»? Возможно «нечто» происходит чуть раньше, чем сеть пропадает

/etc/network/interfaces не правился?

anymouze ★★
()
Ответ на: комментарий от anymouze

Тут сразу два момента, софт и хард, хотя возможно только софт. Точнее софт есть точно. Нет переподнятия после падения интерфейса.
Софт проверять можно «до посинения» как предложил vodz, точнее его вариант не самый лучший, проще патч выдернуть, чем целиком свитч вырубать. Это одна задача.
Но и хард тоже надо как-то выяснить, с какого фига линк падает в означенное время? Хотя это так же может остаться софтовой проблемой.

anc ★★★★★
()
Ответ на: комментарий от anc

констатация факта

в «этот момент» что-то происходит снаружи и/или внутри. интерфейс падает...

Был бы это десктоп можно было бы «поменять» систему (просто переустановить). А тут...

Допустим свитч «ребутиться»: на других машинах это же не пройдёт незаметно? Но опять, как узнать (это возможно)?

«Первопричина» может быть и из «хард» приходит. Восстановление через скрипт выполняется. Софт сам почему-то не отрабатывает. И нигде про это ничего (в логах?) — вот это «жуть»

Один из Y серверов...

Ладно. Снова «буду ошибаться». Каталоги if* модифицировались 22 августа — и по срокам 1.5 месяца (конечно и это окажется ложным следом) Но может что-то в это время обновлялось (ставилось)

Кстати, ведь (если я не прозевал опять) неизвестно, когда стал линк пропадать (только с момента, когда перестал подниматься проблема стала известна).

даже на выходных, когда юзеров нет

и на выходные нельзя «машинку» поменять?

anymouze ★★
()
Ответ на: комментарий от anc

мистика?

вот поиск выдал похожий (?) случай — тоже Ubuntu 16.04, тоже статика прописана в /etc/network/interfaces, тоже проблема с сетью (но там больше на драйвер упор). По ссылке, как раз описывается что «так не работает». Прямо «как надо» не написано (может не разглядел?). Как я это понял /etc/network/interfaces нужно, как «по-умолчанию». А статику задавать в других файлах...

можно этому верить?

*в других источниках делают перезапуск networking, когда интерфейс не поднимается.

странно это

anymouze ★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.