Система: centos7, кастомное ядро, система не обновлялась где-то месяц.
openmpi: собрано вручную (по некоторым причинам) из последнего релиза 1.10.
Команда от рута
mpiexec --allow-run-as-root --hostfile hostfile hostname
зависает без вариантов и ничего не происходит.
В hostfile находятся ip двух нодов. Если не указывать hostfile
(либо не указывать --host node1,node2), то mpiexec работает нормально с любыми параметрами. С ssh проблем нет, захожу по беспарольным ключам в обе стороны.
В .bashrc прописано:
export PATH=/opt/ompi/bin/:$PATH
export LD_LIBRARY_PATH=/opt/ompi/lib/:$LD_LIBRARY_PATH
Ради эксперимента попробовал с обычным openmpi (установив его из репов, не делая update, и поменяв переменные окружения). Результат — тот же самый (mpiexe виснет).
А при тех же настройках на обычных свежеустановленных виртуалках, всё работает прекрасно.
Вопросы:
1 — нужен перечень идей и версий, где искать ошибку.
2 — как и где (логи, сообщения и т.д.) стоит искать сообщения об этой ошибке?