Добрый день!
Возникла проблема с настройкой кластера Rocks Cluster на CentOS.
Постараюсь расписать всё подробно с самого начала.
Установил головную машину «Cluster» дистрибутив Rocks Cluster 6.1 используя Virtual Box.
Разбиение диска поставил автоматическое. После установки, в командной строке ввел команду «insert-ethers», выбрал пункт Compute.
Запустил на установку вычислительные узлы «Node0» и «Node1».
После установки вычислительных узлов, я проверил работоспособность встроенных компиляторов fortran.
Завел пользователя User на головной машине, домашняя папка его «/Home/User».
Скопировал папку «test» с программой Fortran по адресу «/Home/User».
Далее вид командной строки:
[user@cluster Desktop]# cd ~/test
[user@cluster test]# mpif77 flops.f -o flops
[user@cluster test]# ./flops
HPC Test ----------------------------------------
Quantity of processors = 1
Calculation time = 1.03 seconds
Cluster speed = 1746 MFLOPS
-------------------------------------------------
Cluster node N00 speed = 1746 MFLOPS
-------------------------------------------------
И так, что я сделал для этого...
информацию брал с сайта http://cluster.linux-ekb.info/
1. Настроил беспарольный доступ SSH
Алгоритм обеспечения беспарольного доступа следующий:
Логинимся к консоли кластера: ssh user1@server
Переходим в каталог ssh: cd ~/.ssh
Генерируем rsa-ключи: ssh-keygen -t rsa
На вопрос задать имя файла жмем Enter - остается имя по умолчанию id_rsa.
На просьбу задать пароль жмем Enter два раза (второй раз для проверки).
Копируем публичный ключ на узел кластера: scp id_rsa.pub user1@node1:~/.ssh
Логинимся к узлу node1: ssh user1@node1
Переходим в каталог ssh: cd ~/.ssh
Копируем публичный ключ: cat id_rsa.pub >> authorized_keys2
Отключаемся от узла node1
Повторяем пункты 6-10 для остальных узлов кластера (node2 ... nodeN)
В папке «/Home/User/test» создал файл mpi.hosts, вот его содержимое
compute-0-0
compute-0-1
далее командная строка
[user@cluster test]# mpiexec -hostfile mpi.hosts -np 2 ./flops
HPC Test ----------------------------------------
Quantity of processors = 3
Calculation time = 0.35 seconds
Cluster speed = 5184 MFLOPS
-------------------------------------------------
Cluster node N00 speed = 1728 MFLOPS
Cluster node N01 speed = 1729 MFLOPS
Cluster node N02 speed = 1734 MFLOPS
-------------------------------------------------
Пошел делать все эти манипуляции на реальном сервере и столкнулся с одной проблемой.
т.к. доступ по ssh осуществляется пользователем «User» стал его заводить на головной машине «System > Administration > Users and Groups > Add User» домашней директорией поставил «/Home/User», нажал «ОК», сервер выдал следующую ошибку:
The directory '/home/user' cannot be created ('/home' is not writable). Please choose a writable location.
[root@cluster /]# ls -o
drwxr-xr-x 2 root 0 Sep 3 19:11 home
[root@cluster /]# useradd user --home-dir /Home/user
useradd: cannot create directory /Home/user
Начал думать, что это я что-то намудрил, вернулся из серверной к компу и запустил виртуалку. Что же вы думаете? я теперь и на виртуалке не могу добавить пользователя в папку «/Home/», но уже заведенный пользователь работал как надо. Поправка, пока писал это сообщение папка «/Home/user» пропала сама по себе!!!
Может кто-нибудь подсказать, в чем моя ошибка, и что вообще происходит???