Есть VMware esxi 6.5.0
Неделю назад упали все виртуальные машины на сервере.
Сейчас то же самое. В 13:33 выключились все виртуальные машины. Залез в логи. Что нашел, на мой взгляд интересного.
В /var/log/vmkernel.log куча записей вида
2018-05-04T14:03:55.420Z cpu0:65557)ScsiDeviceIO: 2927: Cmd(0x4395009b4700) 0x85, CmdSN 0x27 from world 67408 to dev "naa.50014ee103aa63fc" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0xb 0x0 0x0.
2018-05-04T14:03:55.450Z cpu0:65557)ScsiDeviceIO: 2927: Cmd(0x4395009b4700) 0x85, CmdSN 0x27 from world 67408 to dev "naa.50014ee103aa63fc" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0xb 0x0 0x0.
2018-05-04T14:03:55.453Z cpu0:65557)ScsiDeviceIO: 2927: Cmd(0x4395009b4700) 0x85, CmdSN 0x27 from world 67408 to dev "naa.50014ee103aa63fc" failed H:0x0 D:0x2 P:0x0 Valid sense data: 0xb 0x0 0x0.
2018-05-04T14:03:55.474Z cpu0:65557)ScsiDeviceIO: 2962: Cmd(0x4395009b4700) 0x85, CmdSN 0x27 from world 67408 to dev "naa.50014ee103aa63fc" failed H:0x5 D:0x0 P:0x0 Invalid sense data: 0x0 0x0 0x0.
2018-05-04T14:04:10.650Z cpu0:66014)NMP: nmp_ResetDeviceLogThrottling:3348: last error status from device naa.5000c5001a3c4a5d repeated 290 times
2018-05-04T14:04:40.650Z cpu0:66014)NMP: nmp_ResetDeviceLogThrottling:3348: last error status from device naa.50014ee103aa63fc repeated 476 times
В /var/log/syslog.log
2018-05-04T14:02:35Z smartd: libsmartsata: is_ata_smart_device:5 buf[82]:1 rc:0
2018-05-04T14:02:35Z smartd: libsmartsata: is_ata_smart_enabled mode_page fd:5 val:1
2018-05-04T14:03:15Z smartd: libsmartsata: SG_IO ioctl ret:0 status:0 host_status:3 driver_status:0
2018-05-04T14:03:15Z smartd: libsmartsata: error reading smart values
2018-05-04T14:03:15Z smartd: libsmartsata: closing fd:5
2018-05-04T14:03:15Z smartd: smartmgt: plugin /usr/lib/vmware/smart_plugins/libsmartmicron.so is already loaded
2018-05-04T14:03:15Z smartd: smartmgt: plugin /usr/lib/vmware/smart_plugins/libsmartnvme.so is already loaded
2018-05-04T14:03:15Z smartd: smartmgt: plugin /usr/lib/vmware/smart_plugins/libsmartmicron.so is already loaded
2018-05-04T14:03:15Z smartd: smartmgt: plugin /usr/lib/vmware/smart_plugins/libsmartnvme.so is already loaded
2018-05-04T14:03:15Z smartd: libsmartsata: is_ata_smart_device:5 buf[82]:1 rc:0
2018-05-04T14:03:15Z smartd: libsmartsata: is_ata_smart_enabled mode_page fd:5 val:1
2018-05-04T14:03:15Z smartd: libsmartsata: ATA SMART device vid:ATA WDC WD3200AAKS-0 pid:WDC WD3200AAKS-0
2018-05-04T14:03:55Z smartd: libsmartsata: SG_IO ioctl ret:0 status:0 host_status:5 driver_status:0
2018-05-04T14:03:55Z smartd: libsmartsata: error reading smart values
2018-05-04T14:03:55Z smartd: libsmartsata: closing fd:5
Могут эти записи значить, что умирает жесткий диск?
Если нет, то на что еще обратить внимание?