LINUX.ORG.RU

Пропадает связь с сервером.

 , , ,


0

2

What's up!

Вопрос один: кто виноват и что делать ?

Коротко: Сервер становится полностью недоступным ни по SSH, ни по каком либо другому протоколу, только локально. Как часто - полный рандом: от однго раза в месяц (было раньше) до нескольких раз в день. dmesq и другие логи не показывают ровным счетом ничего: чисто. Перегрева ЦП вроде нет (так на всякий сообщаю). IP адрес не используется. Методом тыка удалось установить следующее: во время так называемого блэкаута (сервер недоступен) нет пинга к сервеу, ни от него к любому LAN хосту, более того, помогает systemctl restart network.

Что делал:

1. Написал скрипт, как временный солюшен: пингует раз в минуту два хоста, если оба не доступны - перезапускает сеть и делает запись в файл об этом событии. Собственно отсюда я и стал понимать, что это происходит до нескольких раз в день.

2. Поставил другую PCI-E сетевую карту: стал зависать наглухо так, что скрипт (описанный выше даже не приводит его в чувство). Помогает только ребут локально.

3. Пробовал поставить проприетарный драйвер с сайта Realtek. Все закончилось: No rule to make target `clean'. Stop.

(вот здесь достаточно подробно описал.)

Мои мысли:

1. Проблема с MB (~ 2008 года выпуска).

2. Пробелма с БП (примерно ее ровесник).

3. Может кто знает, как порезолвить No rule to make target `clean'. Stop. issue (описано выше, чтобы проверить версию с драйвером хотябы до конца).

Исходные данные:

1. 3.10.0-327.36.3.el7.x86_64
2. CentOS Linux release 7.2.1511 (Core)
3. "Родной" драйвер
r8169 Gigabit Ethernet driver 2.3LK-NAPI loaded

4. «Родной» сетевой контроллер

*-network:0 UNCLAIMED
       description: Ethernet controller
       product: RTL-8110SC/8169SC Gigabit Ethernet
       vendor: Realtek Semiconductor Co., Ltd.
       physical id: 0
       bus info: pci@0000:02:00.0
       version: 10
       width: 32 bits
       clock: 66MHz
       capabilities: pm cap_list
       configuration: latency=32 maxlatency=64 mingnt=32

5. PCI-E сетевая карта, которую устанавливал

*-network:2
       description: Ethernet interface
       product: SMC2-1211TX
       vendor: Accton Technology Corporation
       physical id: 3
       bus info: pci@0000:02:03.0
       logical name: enp2s3
       version: 10
       serial: 00:10:b5:c0:43:bb
       size: 100Mbit/s
       capacity: 100Mbit/s
       width: 32 bits
       clock: 33MHz
       capabilities: pm bus_master cap_list ethernet physical tp mii 10bt 10bt-fd 100bt 100bt-fd autonegotiation
       configuration: autonegotiation=on broadcast=yes driver=8139too driverversion=0.9.28 duplex=full ip=192.168.1.4 latency=32 link=yes maxlatency=64 mingnt=32 multicast=yes port=MII speed=100Mbit/s
       resources: irq:22 ioport:ca00(size=256) memory:fddfc000-fddfc0ff

Ну и послденее, очень подробно и на Омерикансом написано вот тут.

Проблема до сих пор есть. Заранее благодарствую за любые конструктивные мысли.

Cheers.



Последнее исправление: Uncle_Sam (всего исправлений: 1)

Поставил другую PCI-E сетевую карту: стал зависать наглухо так, что скрипт

IMHO в такой ситуации лучше начать с тщательного осмотра ёмкостей на предмет вздутия или следов подтекания, а потом замена БП.

Найди какой-нибудь stress-тест типа stress и погоняй.

Модель матери какая ? может она уже давно должна быть на свалке...

vel ★★★★★
()
Последнее исправление: vel (всего исправлений: 1)
Ответ на: комментарий от vel

1. Проверял кондеры- вроде выглядят нормально. 2. Пардон, ссылку на мать поправил в тексте. А так - IP35 Pro XE от Abit

Uncle_Sam
() автор топика
Ответ на: комментарий от Uncle_Sam

Если есть приличный gpu - нагрузи его и дохлый БП сразу даст о себе знать.

Если оно проработало 8 лет, то ёмкость точно уже уменьшилась.

Определить емкость можно определить только после выпаивания :(

vel ★★★★★
()
Ответ на: комментарий от vel

Если есть приличный gpu - нагрузи его и дохлый БП сразу даст о себе знать.

Попробую поискать, на крайни случай возьму у дизайнеров из ПК.

Найди какой-нибудь stress-тест типа stress и погоняй.

Да, спасибо. Думал в этом направлении: буду гуглить какие нибудь консольные стресс тесты, чтобы првоерить БП да и вообще все компоненты.

Дело просто осложенно тем, что надо сначала найти какую-нибудь подменную машину, ибо назначение сервера - самба шара. Просто так не остановить, да и офис удаленный: не наездишься много.

Если оно проработало 8 лет, то ёмкость точно уже уменьшилась.

На тачке висит: 2 RAID 1 (2x500Gb and 2x2Tb) + 1x3Tb диск. Может БП не вывозит уже....

Uncle_Sam
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.