Проболема раз - если поднять любой сетевой интерфейс, кроме нулевого, пишет:
Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.352979] Uhhuh. NMI received for unknown reason b1 on CPU 0.
Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.353044] You have some hardware problem, likely on the PCI bus.
Message from syslogd@localhost at Apr 2 09:29:57 ... kernel:[ 227.353106] Dazed and confused, but trying to continue
и сетевушка отключается. Иногда вместо этого случается kernel panic.
Проблема 2 - даже когда использую только один порт, если есть небольшая сетевая активность, в ядре появляется сообщение:
[121030.457885] eth0: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121030.457939] eth1: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121030.457990] eth2: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down. [121062.437873] netxen_nic: card response timeout. [121062.437902] netxen_nic: Failed to destroy rx ctx in firmware [121094.417869] netxen_nic: card response timeout. [121094.417898] netxen_nic: Failed to destroy tx ctx in firmware [121094.460703] eth3: Device temperature 100 degrees C exceeds maximum allowed. Hardware has been shut down.
Что есть явный бред. Тут в похожих темах просят показать это:
$ lspci -vs 06:00.0
06:00.0 Ethernet controller: NetXen Incorporated NX3031 Multifunction 1/10-Gigabit Server Adapter (rev 42)
Subsystem: Hewlett-Packard Company NC375i Integrated Quad Port Multifunction Gigabit Server Adapter
Flags: bus master, fast devsel, latency 0, IRQ 24
Memory at fae00000 (64-bit, non-prefetchable) [size=2M]
Memory at f8000000 (64-bit, non-prefetchable) [size=32M]
Capabilities: <access denied>
Kernel driver in use: netxen_nic
Kernel modules: netxen_nic
$ dmesg |grep eth
[ 1.796876] ACPI Error (psparse-0537): Method parse/execution failed [\_SB_._OSC] (Node ffff880426c14f20), AE_AML_BUFFER_LIMIT
[ 2.432767] netxen_nic 0000:06:00.0: eth0: GbE port initialized
[ 2.434177] netxen_nic 0000:06:00.1: eth1: GbE port initialized
[ 2.435628] netxen_nic 0000:06:00.2: eth2: GbE port initialized
[ 2.437115] netxen_nic 0000:06:00.3: eth3: GbE port initialized
[ 8.754656] netxen_nic: eth0 NIC Link is up
[ 8.755739] ADDRCONF(NETDEV_UP): eth0: link is not ready
[ 8.760126] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
[ 19.319590] eth0: no IPv6 routers present
Стоит debian squeeze (в lenny эта сетевушка отказывается работать - требует новый пакет с бинарной прошивкой firmware-bnx2, который не работает без нового ядра). Обновлял постоянно уже недели 3 в надежде, что ошибка общая, а, значит, будет вскоре замечена и исправлена. На bugs.debian.org ничего похожего на мой случай не нашёл. Попытка собрать драйвер с официального сайта успехом не увенчалась (там захардкодено окружение RedHat или SLES), но если заглянуть в исходник драйвера, то видно, что там захардкодена та же бинарная прошивка. Машинка - HP ProLiant ML370 G6.
Куда копать дальше?