LINUX.ORG.RU

Обнаружить 12309


0

4

Итак, позвонили из конторы и жалуются что сервер с suse в последнее время при выполнении бэкапов и копировании их (наверное по сети или может на ленту какую-нибудь) жутко зависает.
Первое что пришло в голову - это 12309. Но только я про этот баг, только наслышан, сам никогда не видел.
Вопрос: как понять что это оно ? То есть что нужно прочитать в dmesg дабы $сабж ?

★★★★★
Ответ на: комментарий от GotF

Ну top покажет повышенную нагрузку на проц и почти полный свап. И всё ?
То есть нигде в логах не будет написано что-то более конкретное ?
И ещё посоветуйте утилитки для таких случаев, сам знаю: top,free и atop. Дополните полезным.

dada ★★★★★
() автор топика
Ответ на: комментарий от dada

Ну top покажет повышенную нагрузку на проц и почти полный свап.

Щито? При чём тут своп, лол? Смотри %wa.

GotF ★★★★★
()
Ответ на: комментарий от dada

Да, если выше примерно 50-70%. Если у тебя есть ещё какие-то симптомы, это уже что-то другое.

GotF ★★★★★
()
Ответ на: комментарий от dada

почти полный свап

Это мало имеет отношения к 12309. Скорее к недостатку ОЗУхи, то есть неправильному планированию нагрузки на сервер, или плохому знанию матчасти при задании тех.условий на эксплуатацию.

imul ★★★★★
()
Ответ на: комментарий от dada

баг проявляетсяя просто: когда у тебя кол-во dirty pages превышает vm.dirty_ratio или vm.dirty_bytes то ось начинает сброс страниц на диск с принудительной остановкой всех пишущих на диск процессов до полного окончания операции. В этот момент wa, по-моему, высок. Часто в dmesg вылезала хрень о том что task blocked for more than 120s (это если у сервера много оперативы). Вот как раз на бэкап-серверах оно частенько и вылезает. Мы с этим шаманили какими-то самопальными скриптами которые ionice выставляли, пишущие процессы останавливали если диск не справлялся итп. В общем, для бэкап-сервера это не смертельно, а вот для боего писец.

Если это бэкап-сервер то воткните свежую ось с ведром 3.2+, на лоре говорили что это помогает (сам не тестил).

true_admin ★★★★★
()
Ответ на: комментарий от true_admin

когда у тебя кол-во dirty pages превышает vm.dirty_ratio или vm.dirty_bytes то ось начинает сброс страниц на диск с принудительной остановкой всех пишущих на диск процессов до полного окончания операции

А установить vm.dirty_pages в небольшое количество вы не догадались? Конечно, если ядро будет скидывать на диск половину дискового кэша (т.е. порядка 1Гб на современных машинах), на это нужно некоторое время.

no-such-file ★★★★★
()
Ответ на: комментарий от no-such-file

А установить vm.dirty_pages в небольшое количество вы не догадались?

догадались, это весьма частично решало проблему. Нам больше подошло поднять это до предела и опустить dirty_background_ratio.

на это нужно некоторое время.

сервера как бы загруженные были, большие буфера нужны чтобы сглаживать нагрузки.

true_admin ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.