LINUX.ORG.RU
решено ФорумAdmin

Warning: RLIMIT_MEMLOCK is 32768 bytes - а уже поставил в limits.conf unlimited, что делать?


0

1

Падают задачи на кластере, ругаются примерно так:

libibverbs: Warning: RLIMIT_MEMLOCK is 32768 bytes.
    This will severely limit memory registrations.
cfx5remote: Rank 0:3: MPI_Init: ibv_create_cq() failed
cfx5remote: Rank 0:3: MPI_Init: Can't initialize RDMA device
cfx5remote: Rank 0:3: MPI_Init: Internal Error: Cannot initialize RDMA protocol

В /etc/security/limits.conf:

* soft memlock unlimited
* hard memlock unlimited
Как отдебажить, что там где падает, кому не хватает памяти и откуда берется 32768, если стоит unlimited?

★★★

Последнее исправление: pianolender (всего исправлений: 1)
Ответ на: комментарий от anonymous

Ой, там все проше оказалось: в конфиг планировщик откуда-то просочилась опция, согласно которой он не передавал задачам под собой кастомный rlimit_memlock из системы, и оставлял дефолтный - как раз тот маленький. Подкрутил конфиг, рестартнул демоны планировщика - вроде заработало.

Неприятно, что этот косяк с конфигом каким-то образом совпал по времени с обновлением планировщика, что навело подозрения пользователей. Ну да ладно.

Сольвед. Спасибо!

pianolender ★★★
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.