Доброго времени суток.
Надеюсь, кому-нибудь информация пригодится. В vsphere 5.0, по сравнению с предыдущими версиями, имеет одну важную багофичу: типовая процедура по удалению datastore превратилась в типовой инцидент. Нельзя удалять lun на массиве без предварительных хитрый действий.
К чему приведут неправильные действия:
- esxi'и будут в бесконечном (?) цикле сканировать fc шину в поисках потерянных lun'ов. Несмотря на то что в datastore'ах они не используются.
- все обращения к storage подсистеме будут виснуть или отваливаться по тайм-ауту
- из-за предыдущего пункта через некоторое время отвалятся management агенты на esxi'ях. И если вы не сделали предусмотрительно доступ по ssh или через консоль сервера - управление полностью потеряно.
- При этом ВМ продолжат работать, хоть и с тормозами по IO
- поможет только жёсткий ребут серверов esxi по питанию.
В тему:
- vmware communities: Rescan all HBA after unpresenting luns is stuck ( тема не моя, но я получил ту же самую проблему )
- knowledge base: Unpresenting a LUN in ESXi 5.x
- vspehre blog: Best Practice: How to correctly remove a LUN from an ESX host
Будьте осторожны
З.Ы. Проблема «отлично» воспроизвелась на esxi 5.0 u1 build 702118 + VC 5.0 u1 build 623373 + MSA P2000 G3