LINUX.ORG.RU

Начал шуметь сервер

 , ,


0

2

Сервер HP DL380 Gen8.
Пять лет работал отлично, последний месяц начал периодически шуметь, кулера набирают обороты, причем не просто набирают, а включаются как в режиме продувки (максимальные обороты). может и 3 дня в таком режиме работать, может и 10 сек каждые 10 минут. Вскрыл крышку, всё чисто, кисточкой и пылесосом на выдув на всякий случай прошел по всему до чего добрался - результат нулевой. Температура на процессоре в районе 40°C, на чипсете ~44°C, на HD Controller ~52°C. Кулера все ok. Нагрузки нет. Обратил внимание что во время «продувки» iLO не доступен. В BIOS обороты регулировать нельзя, только режимы работы, стоит оптимальный. От температуры в помещении результат не зависит.

Что с ним сделать что бы не шумел?

★★

Последнее исправление: StellzZz (всего исправлений: 1)

смазать кулеры - с высохшей за пять лет смазкой не помешает. каплю машинного масла или солидольчика.

pfg ★★★★★
()

Обратил внимание что во время «продувки» iLO не доступен. В BIOS обороты регулировать нельзя, только режимы работы, стоит оптимальный.

А в логе BMC он чего-нибудь пишет? На супермикрах это бывает от падения оборотов вентиляторов ниже определенной отметки, здесь скорее всего тоже самое.

Deleted
()
Ответ на: комментарий от mandala

При попытке запросить лог AHS пишет bb_dl_disabled

StellzZz ★★
() автор топика
Ответ на: комментарий от Deleted

Что такое ВМС? в iLO Event Log много было записей Last/Initial Update c [NOT SET]. в Integrated Management Log свежих записей нет, остальные качаются жесткого диска, смарт не нравится.

StellzZz ★★
() автор топика
Ответ на: комментарий от pfg

кулера все отлично крутятся. тут другое что то, сервер вдруг начинает набирать обороты, до дикого свиста от оборотов, как самолёт на взлёте. раньше такое только при включении было, когда севрер инициализировал оборудование

StellzZz ★★
() автор топика
Ответ на: комментарий от StellzZz

Что такое ВМС?

iLO и есть. Baseboard Management Controller.

Железо новое недавно не добавляли? Если не ошибаюсь с теми же хардами может быть проблема, если они не находятся в списке совместимости вендора (не могут корректно отобразить температуру из смарта). Правда тогда бы он крутил вентиляторами на 100% постоянно, не снижая обороты.

Deleted
()
Ответ на: комментарий от Deleted

Вот еще для ознакомления: r/sysadmin

tl;dr: Обновить iLO, поменять термопасту, ребутнуть сервер с выключением питания, поискать в BIOS параметр High Altitude Mode и выключить его, если он включен.

Deleted
()
Ответ на: комментарий от Deleted

железо новое не добавлял, в конфигурацию изменений не вносил. харды HP SAS из списка совместимых

StellzZz ★★
() автор топика
Последнее исправление: StellzZz (всего исправлений: 1)

Я встречал такое как реакцию на ошибку, практически любую:

- открыта крышка корпуса

- нет напряжения на одном из БП

- проблемы с контроллером

То есть я бы начал с устранения ошибок из логов.

pkuutn
()

а может так iLO чудить? раза с 10-го зайти удётся, по любому пункту по минуты 3-5 переходит, еще и выкинет раза два, при этом громко жужжа кулерами. может действительно BIOS/iLO требует прошивки/перезагрузки? но у меня пару лет назад расширенная гарантия закончилась. Да и система мягко говоря боевая что бы экспериментировать...

StellzZz ★★
() автор топика
Ответ на: комментарий от StellzZz

В лююом случае надо готовить замену этому серваку. Т.к. если ничего делать не будешь, то тоже есть шанс на быстрый выход из строя сервака. Например в таком бешеном режиме продува навернётся один из кулеров и сервак может не захотеть стартовать.

Deleted
()
Ответ на: комментарий от StellzZz

Для ILO порт выделенный?
Режим порта Dedicated (в настройках ILO)?

slowpony ★★★★★
()

Я помню, когда мы нашему дяденьке офисному админу жаловались на гудящий вентилятор в системнике, он в него карандашик втыкал. Не гудит? Не гудит. Работай дальше.

во время «продувки» iLO не доступен

Как ты определил что он недоступен? Пробовал ли общаться с ним через ipmitool?

slowpony ★★★★★
()
Ответ на: комментарий от slowpony

на счёт порта не знаю, я лет 5 к нему не подходил, шуршит себе и шуршит, с трудом вспомнил IP адрес подключения к iLO. Как определил что недоступен? В браузере ввожу IP адрес, пытаюсь авторизоваться - не получается, либо крутит с выхлопом что страница не найдена, либо ввод данных для авторизации недоступен, либо что соединение закрыто, либо подождите 20 сек... после авторизации по менюшкам ходить пытюсь, за некоторое время до срабатывания кулеров, во время работы кулеров, и после работы кулеров дико тормозит переход, либо совсем выкидывает на страницу не найдена. либо не полностью прогружает, либо на авторизацию выкидывает... может совпадение, но есть такой момент.

StellzZz ★★
() автор топика
Ответ на: комментарий от Deleted

В лююом случае надо готовить замену этому серваку.

интересно разобраться с этим, для начала хотелось бы пообщаться с знающими людьми на эту тему, самому разобраться, так лучше вникаешь в суть, к интегратору или платной поддержке на данном этапе не хотелось бы обращаться, так как они ничего не объясняют. А менять сейчас... сложная финансовая ситуация у всех, боюсь не выделят денег на новый. Да и у этого не весь потенциал еще раскрыт, расточительно получается

StellzZz ★★
() автор топика
Последнее исправление: StellzZz (всего исправлений: 2)
Ответ на: комментарий от StellzZz

Попробуй проверить что оба БП в рабочем состоянии. Запусти сервак без дисков. Посмотри все логи, которые ведёт bios,ilo и т.п.

Deleted
()
Ответ на: комментарий от StellzZz

Веб-морда у них часто всратая по разным причинам. Перепрошивка это лечит не всегда. Попробуй использовать ipmitool вместо веб-морды.

slowpony ★★★★★
()

DL320 G8 чудили точно так же, на одном помогло обновление iLo, на другом обновление зависало на 1%, поменяли по гарантии материнку

Bloody ★★
()

Биос шей для начала

K12
()

Пальцем в небо: доступ к веб-морде IPMI ограничен? Может быть ее в отдельный vlan засунуть? А то мало ли какие роботы там ходят. P.S.: будешь шить и получишь непонятный результат - попробуй повторить операцию несколько раз, оно иногда не с первого раза хорошо происходит. Олсо, не сохраняй настройки при обновлении, сбрось и настрой заново.

slowpony ★★★★★
()

всем спасибо, попробую прошить, но не сейчас, бухгалтера бухтят. Ситуация более или менее стабилизировалась после того как еще раз обесточил сервер, нажал кнопку питания, снял крышку, переподключил все шлейфы, вынул/вставил харды, перенастроил пару параметров в БИОС на максимальную производительность POWER чегототам... режим работы кулеров поменял на максимум потом вернул на оптимальный... бывает подвывает иногда, но уже не дщо такой степени и производительность вернулась. Впереди ждёт перенастройка программной части сервера, вот тогда и попробуем найти прошивки и обновить.

ipmitool надо разбираться с ним, не могу на него выделить время, но вернусь, хочется пощупать

StellzZz ★★
() автор топика
Последнее исправление: StellzZz (всего исправлений: 1)
23 октября 2020 г.

ох уж этот gen8 с его многострадальным nand flash -( -обновить FW iLO до последнего (на горячую) -после iLO покажет что у него проблема с nand flash памятью -после этого появится кнопка «отформатировать nand flash» (на горячую) -жмыкаем, тут 50на 50, либо поможет, либо нет. -если помогло - позеленел -отключить сбор AHS лога (если не на конракте в HPE сервер, что врядли судя по всему), скорее всего ошибка проявит себя снова, но когда - рандом. -если форматирование не помогло, -то остаемся жить с этим, перегружаем сервер с обесточиванем, отключаем сбор AHS лога. -дальше ранодомно - т.е.проблема иногда может проявлять себя в виде долгого конекта к вэб-роже, а также иногда выкручивать обороты. При этом сам продакшен от этого не страдает в принципе, бухглатера про эту проблему никогда не узнают (если только сервер находится не в их помещении))) удачи

https://support.hpe.com/hpesc/public/docDisplay?docId=emr_na-c04996097

anonymous
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.