Сейчас я (по работе) провожу учебный курс по Yocto Project. Для тех кто не в курсе - это вроде Gentoo, только кросс-компилированный для всяких странных процессоров типа ARM. Т.е. это надо собирать, и это нагружает процессор по полной, и это долго. Чтобы не было проблем с настройкой среды разработки у учащихся, решили все компилировать и тестировать на выделенном сервере. Заказывали сервер тут: https://www.reliablesite.net/dedicated-servers/Quad-Core-server/intel-core-i7... (по принципу «поближе к учащимся и побыстрее»)
Итог: оно у всех скомпилировалось как надо, учебный процесс идет, но вот в dmesg есть весьма неприятные строчки.
[11532.886461] CPU7: Core temperature above threshold, cpu clock throttled (total events = 1)
[11532.886462] CPU3: Core temperature above threshold, cpu clock throttled (total events = 1)
[11532.886463] CPU4: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886465] CPU0: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886465] CPU6: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886466] CPU1: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886467] CPU2: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886468] CPU5: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886468] CPU3: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.886683] CPU7: Package temperature above threshold, cpu clock throttled (total events = 1)
[11532.887477] CPU3: Core temperature/speed normal
[11532.887477] CPU7: Core temperature/speed normal
[11532.887478] CPU1: Package temperature/speed normal
[11532.887479] CPU2: Package temperature/speed normal
[11532.887480] CPU5: Package temperature/speed normal
[11532.887480] CPU6: Package temperature/speed normal
[11532.887481] CPU3: Package temperature/speed normal
[11532.887481] CPU7: Package temperature/speed normal
[11532.887482] CPU4: Package temperature/speed normal
[11532.887482] CPU0: Package temperature/speed normal
[19251.206576] perf: interrupt took too long (2502 > 2500), lowering kernel.perf_event_max_sample_rate to 79750
...
и еще много такого же
Т.е. с системой охлаждения на сервере явно не все в порядке.
Для сравнения попробовал собрать Yocto на выделенном сервере с похожей конфигурацией у OVH в Сингапуре (https://www.ovh.com/sg/dedicated-servers/game/173mc9.xml). Там такой проблемы нет - все собралось, жалоб на перегрев в dmesg нет. Но: на этом сервере thermald стоит (был там по умолчанию), а на сервере, где произошел перегрев - нет.
Хотелось бы у собрать побольше данных, на каких хостингах еще есть сервера с плохим охлаждением процессора. Чтобы еще раз не обжечься.