Обнаружить 12309

0

4

Итак, позвонили из конторы и жалуются что сервер с suse в последнее время при выполнении бэкапов и копировании их (наверное по сети или может на ленту какую-нибудь) жутко зависает.
Первое что пришло в голову - это 12309. Но только я про этот баг, только наслышан, сам никогда не видел.
Вопрос: как понять что это оно ? То есть что нужно прочитать в dmesg дабы $сабж ?

Ссылка

←	[firefox][kde][НЁХ]Firefox не запускается по клику на иконку

Альтернативы wget для выкачивания страниц?

→

top

GotF ★★★★★
(26.01.12 09:41:30 MSK)

Ответ на: комментарий от GotF 26.01.12 09:41:30 MSK

Ну top покажет повышенную нагрузку на проц и почти полный свап. И всё ?
То есть нигде в логах не будет написано что-то более конкретное ?
И ещё посоветуйте утилитки для таких случаев, сам знаю: top,free и atop. Дополните полезным.

dada ★★★★★
(26.01.12 09:45:50 MSK) автор топика

Ответ на: комментарий от dada 26.01.12 09:45:50 MSK

htop

SevikL ★★★★★
(26.01.12 09:46:21 MSK)

Ссылка

Ответ на: комментарий от dada 26.01.12 09:45:50 MSK

iotop

anonymous
(26.01.12 09:48:55 MSK)

Ссылка

sudo cast true_admin

dada ★★★★★
(26.01.12 09:50:13 MSK) автор топика

Ответ на: комментарий от dada 26.01.12 09:45:50 MSK

Ну top покажет повышенную нагрузку на проц и почти полный свап.

Щито? При чём тут своп, лол? Смотри %wa.

GotF ★★★★★
(26.01.12 09:51:47 MSK)

Ответ на: комментарий от GotF 26.01.12 09:51:47 MSK

Смотри %wa.

It's all ? Всмысле, и никаких других симптомов ?

dada ★★★★★
(26.01.12 09:53:52 MSK) автор топика

Ответ на: комментарий от dada 26.01.12 09:53:52 MSK

Да, если выше примерно 50-70%. Если у тебя есть ещё какие-то симптомы, это уже что-то другое.

GotF ★★★★★
(26.01.12 09:57:21 MSK)

Ссылка

Ответ на: комментарий от dada 26.01.12 09:45:50 MSK

почти полный свап

Это мало имеет отношения к 12309. Скорее к недостатку ОЗУхи, то есть неправильному планированию нагрузки на сервер, или плохому знанию матчасти при задании тех.условий на эксплуатацию.

imul ★★★★★
(26.01.12 11:05:46 MSK)

Ссылка

Ответ на: комментарий от dada 26.01.12 09:50:13 MSK

баг проявляетсяя просто: когда у тебя кол-во dirty pages превышает vm.dirty_ratio или vm.dirty_bytes то ось начинает сброс страниц на диск с принудительной остановкой всех пишущих на диск процессов до полного окончания операции. В этот момент wa, по-моему, высок. Часто в dmesg вылезала хрень о том что task blocked for more than 120s (это если у сервера много оперативы). Вот как раз на бэкап-серверах оно частенько и вылезает. Мы с этим шаманили какими-то самопальными скриптами которые ionice выставляли, пишущие процессы останавливали если диск не справлялся итп. В общем, для бэкап-сервера это не смертельно, а вот для боего писец.

Если это бэкап-сервер то воткните свежую ось с ведром 3.2+, на лоре говорили что это помогает (сам не тестил).

true_admin ★★★★★
(26.01.12 13:52:49 MSK)

Ответ на: комментарий от true_admin 26.01.12 13:52:49 MSK

когда у тебя кол-во dirty pages превышает vm.dirty_ratio или vm.dirty_bytes то ось начинает сброс страниц на диск с принудительной остановкой всех пишущих на диск процессов до полного окончания операции

А установить vm.dirty_pages в небольшое количество вы не догадались? Конечно, если ядро будет скидывать на диск половину дискового кэша (т.е. порядка 1Гб на современных машинах), на это нужно некоторое время.

no-such-file ★★★★★
(26.01.12 14:04:20 MSK)