Программа StarCCM+, ранее работавшая на другом кластере, не может соединится с RDMA-устройством. Часть вывода:
Starting STAR-CCM+ parallel server
starccm+: Rank 0:239: MPI_Init: ibv_poll_cq(2824): wrong status 12
starccm+: Rank 0:228: MPI_Init: ibv_poll_cq(2824): wrong status 12
starccm+: Rank 0:239: MPI_Init: ibv_ring_all2all() failed
starccm+: Rank 0:228: MPI_Init: ibv_ring_all2all() failed
starccm+: Rank 0:239: MPI_Init: Internal Error: Processes cannot connect to rdma device
starccm+: Rank 0:228: MPI_Init: Internal Error: Processes cannot connect to rdma device
Переменная
I_MPI_DAPL_PROVIDER_LIST=ofa-v2-mlx4_0
/etc/dat.conf
ОС - CentOS 6.8, поддержка IB установлена «из коробки»:
yum -y groupinstall "Infiniband Support"