Доброго времени суток!
Есть такая проблема. Есть машинка с 8ю ядрами и 8ю гигами памяти на борту, предназначенная для проведения ресурсоемких вычислений. Своп отключен, так как если задача начинает свопиться, то говорить об эффективности вычислений смысла нет. Итак. Бывают процессы, которые постепенно сжирают всю память. 8 гигов. После этого система начинает подвисать. ПО ssh на нее зайти невозможно (out of memory). Вообщем машина становится полностью недоступной. Пробовал включать oom_killer в ядре, чтобы убивать процессы, которые сжирают всю память. Но при этом убиваются и ряд других процессов, которые пытаются получить хоть какие-то ресурсы. В последний раз в число таких "хороших" процессов попали sshd, crond и ряд подобных. Причем ситуация еще осложняется тем, что может быть запущенно одновременно 8 процессов, которые делят между собой память. В этом случае oom_killer работает вообще не понять как. Чаще всего вообще ничего не далает и система продолжает висеть. Какие есть пути решения? Может быть можно как-то ограничивать память для процессов? Или есть какие-то более правильные решения?