LINUX.ORG.RU

Температура сервера

 ,


0

1

Доброго дня.

Достался почти даром (так получилось) абсолютно новый HP Microserver 10 gen2 plus. Даже диски (все четыре) и оперативная память были в нераспечатанных коробках, пломбы там, все остальное - ну видно, что нулевый. Поставил Ubuntu server, raid 10 (за исключением загрузки), только создал пользователей, даже файлы не заказчивал, т.е. совершенно пустой и фактически без нагрузки. Температура в помещении - 26-28С.

Как ни зайду на по ssh - Ubuntu показывает, что температура от 65С до 70С, вентиляторы вроде тихонько так работают, при загрузке на самотестировании вообще взвывают на пару сек…

Это для таких серверов нормально, или что-то не то??? А если, как планировал, облако туда прикручу - расплавится???

В Руководстве сказано только, что температура в помещении не должна превышать 35С….



Последнее исправление: kimalex (всего исправлений: 2)

Мне кажется, независимо от типа оборудования, 65-70 градусов для ЦП (о нём же речь-то? Или что за датчик?) в простое - много.
Но, бывает, датчики врут. Иногда - сильно врут.
Эксперименты должны показать, насколько ещё температура вырастет под нагрузкой.

PeleWin
()
Ответ на: комментарий от anonymous

Ага… Ну вот просто это выдается в качестве баннера при каждом входе:


  System load:       2.01

  Usage of /home:    0.0% of 14.13TB

  Memory usage:      1%

  Swap usage:        0%

  Temperature:       69.0 C

  Processes:         156

  Users logged in:   0

А вот на выводе sensors всё немного под другому выглядит… - может быть, и зря запаниковал

Adapter: ISA adapter
Package id 0:  +38.0°C  (high = +90.0°C, crit = +100.0°C)

Core 0:        +36.0°C  (high = +90.0°C, crit = +100.0°C)

Core 1:        +36.0°C  (high = +90.0°C, crit = +100.0°C)

Core 2:        +35.0°C  (high = +90.0°C, crit = +100.0°C)

Core 3:        +37.0°C  (high = +90.0°C, crit = +100.0°C)


i350bb-pci-0200
Adapter: PCI adapter
loc1:          +68.0°C  (high = +120.0°C, crit = +110.0°C)


power_meter-acpi-0
Adapter: ACPI interface
power1:        18446.74 GW (interval = 300.00 s)


coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +38.0°C  (high = +90.0°C, crit = +100.0°C)

Core 0:        +37.0°C  (high = +90.0°C, crit = +100.0°C)

Core 1:        +37.0°C  (high = +90.0°C, crit = +100.0°C)

Core 2:        +36.0°C  (high = +90.0°C, crit = +100.0°C)

Core 3:        +39.0°C  (high = +90.0°C, crit = +100.0°C)


i350bb-pci-0200

Adapter: PCI adapter

loc1:          +69.0°C  (high = +120.0°C, crit = +110.0°C)


power_meter-acpi-0

Adapter: ACPI interface

power1:        18446.74 GW (interval = 300.00 s)
kimalex
() автор топика
Последнее исправление: kimalex (всего исправлений: 3)
Ответ на: комментарий от cobold

А как понять эту строку - только сейчас случайно внимание обратил:

loc1: +69.0°C (high = +120.0°C, crit = +110.0°C)

Разве бывают в выводе такие ошибки, что высокая темп выше, чем критическая??

kimalex
() автор топика
Ответ на: комментарий от cobold

Да я про логику сейчас))

высокая температура - которая выше нормы

критическая - это уже опасные значения

и, по моей логике, высокая не должна быть выше критической

man censors сейчас специально посмотрел, нет там упоминаний про это…

kimalex
() автор топика
Ответ на: комментарий от kimalex

Да с этим i350bb-pci вобще не понятно. Если погуглить, то куча выхлопов sensors, где эти самые +120 и +110. А в даташите на чип написано, что максимальная температура кристалла 123 градуса, и точность их «градусника» +/-3, получается, что 120 — это crit.

Если я правильно понял исходники ядра, то max — это то, что в регистре THLOWTC (Thermal Sensor Low Threshold Control) чипа, а crit, то что в регистре THHIGHTC (Thermal Sensor High Threshold Control).

И, как бы правильно, по иде LOW должно быть меньше HIGH. Но, если я правильно понял даташит, то на каждый Threshold может быть указано любое действие (тротлинг, отключение питания), то есть LOW и HIGH (а ещё MID) условности, и там могут быть любые температуры с завода зашиты. Если хочется копать, берите даташит, дампите регистры полностью и смотрите, что будет делать чип при max и при crit температурах.

mky ★★★★★
()
Ответ на: комментарий от mky

Да все с ним понятно, это гигабитный интеловый сетевой чип аля Intel i350 AM4 сontroller и 68 градусов это его нормальная температура. А путаница с low/high/crit это неверное считывание данных самим lm_sensors. Бывает, что лечится простом sensors-detect, но тут как повезет.

Obezyan
()
Ответ на: комментарий от kimalex

power1: 18446.74 GW (interval = 300.00 s)

Мощность всех АЭС в мире на пару порядков поменьше будет. Сервер запитан напрямую от ближайшей звезды? 🤔 Тогда неудивительно, что температура повышена.

QsUPt7S ★★
()
Последнее исправление: QsUPt7S (всего исправлений: 1)
Ответ на: комментарий от Obezyan

А в убунте при входе просто выводят самую высокую температуру из имеющихся в системе? Или разработчики считают, что температура сетёвки важнее температуры процессора?

mky ★★★★★
()