LINUX.ORG.RU

Проблемы с сервером, зависает


0

1

Установлен сервер del t410 на нем поднят нат-маскардинг сквид апач сарж Ldap+smb, сервер под управлением open SUSE 11.1 клиетов 97 машин под виндой( в домене работают замечательно, шару юзают тож ест-но без проблем, также как часы работает маршрутизиция NAT и прокся, все бы хорошо, но по причинам не понятным, переодически (гтето раз в 4-5 дня) сервер встает в ступор, виснет так что помогает ТОЛЬКО выдергивание шнуров из обоих блоков питания. Судя по логам все в норме, ни где не нашел сбоя по ОС (в логах), даж не знаю в какую сторону рыть. Помогите плиз, направте на путь истинный.

Заранее благодарен.

Память или блок питания. Инфа 93.7%

power
()
Ответ на: комментарий от adepto

температура в норме (порядка 60 *С) на обоих камнях, память ганял, тож норма. И у меня были подозрения во 1 на оперативу во 2 на кулеры, в 3 на рэйд, он кста тож в норме, но как выяснилось позже косяк не в этом ...

klin_001
() автор топика
Ответ на: комментарий от adepto

норма, проверял раз шесть, пробовал по варьировать параметны энергообеспечения, контроля температуры, частот, рэйда, в норме там все

klin_001
() автор топика
Ответ на: комментарий от klin_001

Тогда мистика. Кроме подмены отдельных элементов больше ничего в голову не приходит. Или повесить всё на другую мать. Или погонять под другим линуксом (совсем на всякий случай). Хотя это совсем радикальные варианты. Может в треде ещё что посоветуют.

adepto
()
Ответ на: комментарий от adepto

всеб хорошо я только за такой вариант, только остановка сервера хотяб минут на 10 - 12 приводит к массовым беспорядкам, ввостаниям и ревалюциям в конторе. Даж в выходные дни и ночью (некоторые сотрудники случ чего не успели подключаются к 1с из дома((((( ) глобальная остановка не вариант. Я уже в ахире, представить не мог в какую сторону еще можно копать

klin_001
() автор топика
Ответ на: комментарий от klin_001

кста только сейчас обнаружил артифакт в логе работы

Oct 5 08:34:47 linux-fnbd dbus-daemon: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server Oct 5 08:34:47 linux-fnbd dbus-daemon: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server Oct 5 08:34:47 linux-fnbd dbus-daemon: nss_ldap: could not search LDAP server - Server is unavailable Oct 5 08:34:47 linux-fnbd rchal: CPU frequency scaling is not supported by your processor. Oct 5 08:34:47 linux-fnbd rchal: boot with 'CPUFREQ=no' in to avoid this warning. Oct 5 08:34:47 linux-fnbd rchal: Cannot load cpufreq governors - No cpufreq driver available Oct 5 08:34:49 linux-fnbd hald[3471]: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server Oct 5 08:34:49 linux-fnbd hald[3471]: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server Oct 5 08:34:49 linux-fnbd hald[3471]: nss_ldap: could not search LDAP server - Server is unavailable Oct 5 08:34:49 linux-fnbd hald[3471]: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server Oct 5 08:34:49 linux-fnbd hald[3471]: nss_ldap: failed to bind to LDAP server ldap://localhost: Can't contact LDAP server

больше всего интересует Oct 5 08:34:47 linux-fnbd rchal: CPU frequency scaling is not supported by your processor. Oct 5 08:34:47 linux-fnbd rchal: boot with 'CPUFREQ=no' in to avoid this warning.

бывает это является причиной зависания при перезагрузке а во время работы без понятия, народ кто нить случаем не вкурсе???

klin_001
() автор топика

По мне, это проблема в материнке, раз помогает только её полное обесточивание. ИМХО, надо менять сервер на другой (во избежании революций), а этот мучать, а потом отдавать в сервис.

mky ★★★★★
()
Ответ на: комментарий от mky

сервер то новый, проработал 4 месяца. Кста с утра сегодня стало еще веселее, свалился рэйд (2 уровня), проконфигурен программно не через биос, перемонтирование разделов не помогло, вместе с рэйдом глюк словило ядро, нат-маскардинг и пппое отказали в запуске (рэйд поднят только для информации конторы - шара, базы, доки и тд) ядро оси на обычном скайзи не на рэйде, короче помогла только перезагрузка, меня начинает это наколять... есть какие мысли? какие логи скинуть?

klin_001
() автор топика
Ответ на: комментарий от klin_001

есть какие мысли?

Забрать у бухгалтера системник, склонировать на него содержимое дисков и поставить вместо сервера. А дальше как сказал mky.

adepto
()
Ответ на: комментарий от adepto

жжеш у бухгалтера ))), отдел бухгалтеров обычно самый нервный у нас не исключение, я пока сквида перезапускаю около 9 сек. рестарт, бухгалтерия мой телефон дымится заставляет) мол инета в бравузерах нету а если у нах комп забрать... да не тут косяк в том, что на рейде 15 терабайт, системник не вариант. Буду рыть в сторону рэйда теперь, там кста 15 собрано из разделов разного объема, блин хз, я эти рейды поднимал раз так цать, никогда небыло проблем, хоть с закрытыми глазами. Вечером разгрузится малость еще раз биос посмотрю.

klin_001
() автор топика
Ответ на: комментарий от klin_001

отдел бухгалтеров обычно самый нервный у нас

Это от косынки. Без компьютера сразу полегчает :)

там кста 15 собрано из разделов разного объема

А рейд какой?

adepto
()
  • Немедленно делай бэкапы важных данных. Особенно если что-то странное начало происходить с RAID-массивом.
  • При зависаниях можно попробовать «выловить» сообщения ядра при помощи serialconsole (надёжнее) или netconsole (удобнее). Но если проблема чисто аппаратная, то скорее всего ничего не выйдет.
Deleted
()
Ответ на: комментарий от klin_001

я встречал камень (E6750, если быть точным), который вешался раз в три дня. вне зависимости ни от чего. помогла только замена. так что… не памятью единой.

dmiceman ★★★★★
()
Ответ на: комментарий от klin_001

Если сервер проработал 4 месяца без зависаний, а потом начались проблемы, это ещё они аргумент, что проблема в железе. Попробуйте просто позвонить в сервисный центр, может они чего знаю и, допустим, давно пора перепрошить материнку.

Вобще, вы лучше ответьте на простой вопрос, чтобы вы делали, если бы сервер сгорел с дымом?

mky ★★★★★
()
Ответ на: комментарий от mky

поднял бы резервный, без половины служб, базы из бэкапов конты тож, огреб бы от руководства за мелкие неудобства и был бы уволен через неделю гдет. Тут с этим строговато, прошлого админа уволили из за того что на 8 часов перестал работать интернет в конторе, причем косяк был ростелекома, но это уж потом выяснили ...

klin_001
() автор топика
Ответ на: комментарий от klin_001

а воовще надо начальству обьяснить что нужна хотя бы одна резервная тачка

Slackware_user ★★★★★
()

> но по причинам не понятным, переодически (гтето раз в 4-5 дня) сервер встает в ступор,

виснет так что помогает ТОЛЬКО выдергивание шнуров из обоих блоков питания.


Он с монитором/клавиатурой ? Что-то на монитор выводится ? LA какой в этот момент (можно top заранее повесить) ?

AS ★★★★★
()
Ответ на: комментарий от AS

клава мониор есть так символически, на всяк случай, на монирор выводится консоль ))) нет больше ничего там, не сообщений о эррорах, нчего подозрительного. А что то не догнал, туплю, а top тут при чем, повесить можно вот только актуальности не вижу, раз в логе загрузки и работы все в норме то топом уж точно косяк неотловить, это имхо

klin_001
() автор топика
Ответ на: комментарий от klin_001

> А что то не догнал, туплю, а top тут при чем, повесить можно вот только актуальности не

вижу, раз в логе загрузки и работы все в норме то топом уж точно косяк неотловить, это имхо


я же написал, load average посмотреть. Вдруг там LA зашкаливает.

AS ★★★★★
()
Ответ на: комментарий от klin_001

> 8-10 в среднем

Я имел ввиду в момент, когда всё уже плохо.

AS ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.