Обработка ошибки Out of memory

1

1

Всем привет,

Подскажите куда смотреть. Имеется софтинка, которая активно использует ОЗУ, причем пользователи могут туда залить много данных и написать правила обработки этих данных так, что если правила написали неудачно, то софтинка может выжрать всю память.

Ожидается, что если доступная память закончилась, (своп отключен, оом киллер тоже отключен) процесс из аллокатора получит ошибку, что память кончилась и процесс закончит обработку запроса пользователя и освободит выделенную память.

Но процесс запущен в виртуалке в контейнере, хостится девопсами. Происходит следующее - когда память кончается, потоки запрашивающие память переходят в состояние D и мы видим в стеке следующее:

[<ffffffffb244e13d>] mem_cgroup_oom_synchronize+0x16d/0x590
[<ffffffffb23cdad4>] pagefault_out_of_memory+0x14/0x90
[<ffffffffb29aaf88>] mm_fault_error+0x6a/0x15b
[<ffffffffb29bfa61>] __do_page_fault+0x4a1/0x510
[<ffffffffb29bfb05>] do_page_fault+0x35/0x90
[<ffffffffb29bb7b8>] page_fault+0x28/0x30
[<ffffffffffffffff>] 0xffffffffffffffff

Процесс зависает, докер образ становится необслуживаемым и лечится только перезагрузкой. Что мы готовим не так?

Ссылка

←	copy-and-swap

Suckless альтернатива FreeRTOS

→

своп отключен, оом киллер тоже отключен

сурово. А софтинку научить вести себя корректнее никак?

~~mrjaggers~~
(29.09.23 13:07:32 MSK)

Ответ на: комментарий от mrjaggers 29.09.23 13:07:32 MSK

нет, правила динамические, пользователь может бездумно может написать что угодно. ПО должно как-то адекватно реагировать. Сейчас реакцией является обработка ошибки OOM

sotlef ★
(29.09.23 13:15:07 MSK) автор топика

Перестать страдать херней, и:

Включить OOM-killer
В программе задать разумные ограничения по вложенности и количеству элементов в «правилах».

lovesan ★★☆
(29.09.23 13:30:17 MSK)

Ссылка

Ответ на: комментарий от sotlef 29.09.23 13:15:07 MSK

Тут либо в софтинке предусмотреть предварительную оценку потребления памяти в зависимости от параметров, либо делить её на 2 части – одну помещать в cgroup c лимитом памяти и OOM, другой мониторить статус процессов и завершать запросы как положено.

snizovtsev ★★★★★
(29.09.23 13:32:29 MSK)
Последнее исправление: snizovtsev 29.09.23 13:35:38 MSK (всего исправлений: 2)

Ссылка

memory overcommit отключи, тогда malloc вернет тебе NULL (или аналогичную ошибку для языка на котором написана твоя программа)

Но это только девопсы смогут сделать и не факт что они станут - потому что без оверкоммита может другое сломаться.

Pinkbyte ★★★★★
(29.09.23 13:33:32 MSK)
Последнее исправление: Pinkbyte 29.09.23 13:35:04 MSK (всего исправлений: 3)

Ответ на: комментарий от sotlef 29.09.23 13:15:07 MSK

Мысли в слух.

Проверять хватит ли памяти не попыткой выделения памяти, а проверкой доступной и если хватит + накладные расходы памяти на других жителей виртуалки то дёргать маллок иначе ничего не дёргать и просить пользователя умерить пыл запросов на рамку. Я так понял для процесса пользователя то память выделяется, а вот другим уже не хватает.

LINUX-ORG-RU ★★★★★
(29.09.23 13:37:27 MSK)
Последнее исправление: LINUX-ORG-RU 29.09.23 13:37:40 MSK (всего исправлений: 1)

Ответ на: комментарий от Pinkbyte 29.09.23 13:33:32 MSK

Заметили, что имеется настройка under_oom=1 в memory.oom_control.

under_oom 0 or 1 (if 1, the memory cgroup is under OOM, tasks may be stopped.)

Тестим, возможно в этом проблема.

А overcommit отключить, это как делается? Речь идет о vm.overcommit_memory ?

sotlef ★
(29.09.23 13:38:03 MSK) автор топика
Последнее исправление: sotlef 29.09.23 13:42:16 MSK (всего исправлений: 1)

Ответ на: комментарий от LINUX-ORG-RU 29.09.23 13:37:27 MSK

Ну там параллельно несколько запросов работает. Допустим убедился, что памяти хватит, а другой поток в это время ее съел. В чем тогда резон?

sotlef ★
(29.09.23 13:40:58 MSK) автор топика
Последнее исправление: sotlef 29.09.23 13:47:32 MSK (всего исправлений: 1)

Мимокрокодил.

Судя по ману (man malloc, раздел notes), можно попробовать выставить overcommit в двойку

https://www.kernel.org/doc/Documentation/vm/overcommit-accounting.rst

2 Don’t overcommit. The total address space commit for the system is not permitted to exceed swap + a configurable amount (default is 50%) of physical RAM. Depending on the amount you use, in most situations this means a process will not be killed while accessing pages but will receive errors on memory allocation as appropriate.

Useful for applications that want to guarantee their memory allocations will be available in the future without having to initialize every page.

Но не уверен что это работает так как хочет ТС, и что для ТС есть вариант менять оверкоммит. (Хотя, почему, сбстно нет? Описываешь девопсам конфиг системы, они делают.. а там не знаю)

AndreyKl ★★★★★
(29.09.23 13:48:35 MSK)
Последнее исправление: AndreyKl 29.09.23 13:49:38 MSK (всего исправлений: 1)

Ответ на: комментарий от sotlef 29.09.23 13:38:03 MSK

да, в доке написано `vm.overcommit_memory`

https://www.kernel.org/doc/Documentation/vm/overcommit-accounting.rst

нужно выставить в двойку видимо

AndreyKl ★★★★★
(29.09.23 13:51:36 MSK)

Ссылка

Ответ на: комментарий от AndreyKl 29.09.23 13:48:35 MSK

Спасибо, попробуем следующим, если новые текущие настройки не помогут

sotlef ★
(29.09.23 13:51:43 MSK) автор топика

Ссылка

Ответ на: комментарий от sotlef 29.09.23 13:40:58 MSK

Про параллельно первый раз слышу =) Тогда либо синхронизация в моменты проверки/выделения памяти либо включай своп. Если у тебя память выделяется хаотично и это никак не контролируется и пользователь может задать любой запрос последствия которого в отношении памяти никак не контролируются то на этом мои полномочия всё =) Я лишь предложил.

LINUX-ORG-RU ★★★★★
(29.09.23 13:52:15 MSK)
Последнее исправление: LINUX-ORG-RU 29.09.23 13:53:22 MSK (всего исправлений: 1)

Ссылка

интересно, а поведение на хосте (вне контейнера) поменяется или нет

~~mrjaggers~~
(29.09.23 14:01:48 MSK)

Ссылка

Выставь лимит на память и убери overcommit, иначе тебе ядро в аллокатор -ENOMEM никогда не отдаст.

Dark_SavanT ★★★★★
(29.09.23 14:01:48 MSK)

А сколько памяти у вас планируется выделять под саму софтину/юзера? Подход с выделением всей доступной расходится с политикой запуска в докерах ибо количество всей доступной будет сильно разное в разные моменты времени.

ya-betmen ★★★★★
(29.09.23 14:02:33 MSK)

Ссылка

Ответ на: комментарий от Dark_SavanT 29.09.23 14:01:48 MSK

в доке написано по умолчанию 50%, главное оверкомит убрать как я понимаю и будет возвращать ошибку.

AndreyKl ★★★★★
(29.09.23 14:04:31 MSK)

Ответ на: комментарий от AndreyKl 29.09.23 14:04:31 MSK

Так ему надо сожрать почти всё, но не совсем. А там уже либо крутить лимиты, либо внутри аллокатор шатать, чтобы учитывал сколько уже занято и не вылезал за собственные лимиты.

Dark_SavanT ★★★★★
(29.09.23 14:09:44 MSK)

Ссылка

чтобы malloc возвращал NULL — просто установите ограничение памяти процесса с помощью ulimit перед запуском программы

olelookoe ★★★★
(29.09.23 14:11:44 MSK)

Ссылка

Другой подход, в отличие от ulimit и overcommit.

Сделай свой аллокатор, отожри при старте сколько у тебя позволено, проинициализируй (чтобы реально выделилась) и потом у тебя полный контроль над тем, сколько ее реально еще есть.

blex ★★★★★
(29.09.23 16:10:35 MSK)

Установи ограничение по памяти для процесса через setrlimit(RLIMIT_VMEM) или, если это чужой софт, команду-обёртку над ним - не помню что там в linux, limit или ulimit. При этом настройки системы можно вообще не трогать - ни киллер, ни своп ни оверкоммит.

slovazap ★★★★★
(29.09.23 18:39:34 MSK)

Ссылка

Стандартные аллокаторы не имеет доступа к памяти, поэтому они не имеют понятия когда память закончилась, и следственно не могут вернуть ошибку.

проблема в том что доступ к памяти требует привилегий рута, а писать аллокатор который будет работать только под рутом нецелесообразно.

Рекомендую последовать советам использовать:

ulimit
setrlimit

cvv ★★★★★
(30.09.23 03:49:17 MSK)

Ссылка

Не запещайте оверкоммит. Включите киллера. Это всё, это база.

ulimit - не трогайте это, это не нужно.

hakavlad ★★★
(30.09.23 06:20:34 MSK)

Ссылка

Не пробовал docker контейнеру ограничить размер памяти через –memory?

rupert ★★★★★
(30.09.23 10:17:17 MSK)

Ссылка

Обработку пользовательской нагрузки уноси в контейнер в котором память зарезана с помощью cgroups. С основным процессом связывайся по пайпу. В случае ошибки у тебя будет падать приложение в контейнере, это можно ловить и отправлять пользователю сообщение об ошибку.

Reset ★★★★★
(01.10.23 20:13:39 MSK)

Ссылка

процесс из аллокатора получит ошибку,

Не получит. Man оптимистичное выделение памяти.

PPP328 ★★★★★
(01.10.23 20:45:19 MSK)

Ссылка

Господи, как же у меня горит пердак с того факта, что в 2023 ОС до сих пор не умеет обрабатывать OOM:
Когда линь перестанет виснуть при исчерпании памяти? (2022)
НЕ УМЕЕТ, да. Дело в том, что во-первых порядка 10% должны быть всегда зарезервированы под кэш (иначе система встанет колом на постоянном доступе к диску), а во-вторых несколько процентов памяти всегда должны быть зарезервированы на ядро (ряд функций не может забирать память у кэша).

Сам я следуя советам из треда на десктопе пользуюсь earlyoom, которая по крайней мере для моих задач (медленно жиреющий процесс IDE/браузера/VM) компенсирует отсутствие адекватных механизмов обработки OOM.

Да, одному-двум конейтерам можно поставить суммарный лимит 85%, но как это сделать для заранее неизвестного набора задач — понятия не имею.

byko3y ★★★★
(02.10.23 18:01:10 MSK)

Ссылка

Ответ на: комментарий от blex 29.09.23 16:10:35 MSK

Разве либы станут использовать этот аллокатор? Какая-нибудь функция вроде printf() возмёт при старте себе память, не проинициализирует её и будет работать. А потом при обработке большого сообщения захочет свою память, а свободных страниц и нету...

Уж лучше писать патч в ядро, чтобы отключать overcommit для отдельных приложений.

mky ★★★★★
(03.10.23 00:21:28 MSK)

Ссылка

Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.

←	copy-and-swap

Development

Suckless альтернатива FreeRTOS

→

Похожие темы