LINUX.ORG.RU
ФорумAdmin

Проблема с SuSE 6.3 (система замирает)


0

0

При работе SuSE 6.3 с ядром 2.2.13 через некоторое время
(от 1 дня до нескольких месяцов) система замирает.
При этом нельзя войти в машину ни локально, ни удаленно.
Однако Ping к этой машине идет.
Примерно через час-два все восстанавливается.

Причем все это выявляется на машинах, с разной конфигурацией.
Ядро 2.2.13 и компилялось, и ставилось стандартное из SuSE 6.3.

Кто-нибудь встречался с таким?


Пинг - говорит о тем, что на машине есть питание и что ядро не паникует. Ты логи смотрел на это время? - посмотри на какой процесс приходится это время. Ты на терминал в этот момент выйти можешь (на самой машине).

anonymous
()

на терминал выйти даже на самой машине нельзя.

На одной из машин запускалься indexer (udmsearch) - индексировал
страницы с другого сервера в локольной сети и записывал в базу данных mysql результаты.
На других под разными задачами происходило тоже самое.
Еще на одной был bind4 (только форвадил и держал маленькую зону).

Сообщений от ядра в момент заморозки не было.


eugenes
() автор топика

еще.
На самой машине переключение по виртульным терминалам по Alt-Fx работает.
Можно вводить логин, но до появления Password дело не доходит.

eugenes
() автор топика

Клаву ловит, ядро функционирует - скорее всего у тебя должен один из процессов зажирать ресурсы. Время, когда такое происходит - систематично или нет, и еще время востановления всегда одно и то же?

anonymous
()

На всех машинах стоят разные программы.
Все программы, которые могли так пожирать ресурсы запускались из под сron'a.

Одна используется только как router + сбор статистики(cp /proc/dev/net file)
На ней
#ps xa
PID TTY STAT TIME COMMAND
1 ? S 0:11 init [2]
2 ? SW 0:00 [kflushd]
3 ? SW 0:00 [kupdate]
4 ? SW 0:00 [kpiod]
5 ? SW 0:00 [kswapd]
6 ? SW 0:00 [md_thread]
90 ? S 0:00 /usr/sbin/syslogd
94 ? S 0:00 /usr/sbin/klogd -c 1
136 ? S 0:08 /usr/sbin/sshd
140 ? S 0:00 /usr/sbin/cron
143 tty1 S 0:00 /sbin/mingetty --noclear tty1
144 tty2 S 0:00 /sbin/mingetty tty2
145 tty3 S 0:00 /sbin/mingetty tty3
146 tty4 S 0:00 /sbin/mingetty tty4
147 tty5 S 0:00 /sbin/mingetty tty5
148 tty6 S 0:00 /sbin/mingetty tty6

Я на ней до замирании запустил программу, которая обращалась к куче файлов из одного каталога.


На моих глазах я видел только 2 раза самовосстанавления.
В остальных случаях на машине просто нажимали reset.

eugenes
() автор топика

На всех машинах стоят разные программы.
Все программы, которые могли так пожирать ресурсы запускались из под сron'a.

Одна используется только как router + сбор статистики(cp /proc/dev/net file)
На ней
#ps xa
PID TTY STAT TIME COMMAND
1 ? S 0:11 init [2]
2 ? SW 0:00 [kflushd]
3 ? SW 0:00 [kupdate]
4 ? SW 0:00 [kpiod]
5 ? SW 0:00 [kswapd]
6 ? SW 0:00 [md_thread]
90 ? S 0:00 /usr/sbin/syslogd
94 ? S 0:00 /usr/sbin/klogd -c 1
136 ? S 0:08 /usr/sbin/sshd
140 ? S 0:00 /usr/sbin/cron
143 tty1 S 0:00 /sbin/mingetty --noclear tty1
144 tty2 S 0:00 /sbin/mingetty tty2
145 tty3 S 0:00 /sbin/mingetty tty3
146 tty4 S 0:00 /sbin/mingetty tty4
147 tty5 S 0:00 /sbin/mingetty tty5
148 tty6 S 0:00 /sbin/mingetty tty6

Я на ней до замирании запустил программу, которая обращалась к куче файлов из одного каталога.


На моих глазах я видел только 2 раза самовосстанавления.
В остальных случаях на машине просто нажимали reset.

eugenes
() автор топика

Система замирает не систематически

eugenes
() автор топика

хм, попробуй собирать статистику по загруженности ресусов процессами. типа. Тогда можно будет сказать, что вызвало замирание машины.

Раз ты говоришь что в кроне либо пусто либо 100% - но лёгкие вызовы, тогда ищи по загруженности машинного времени и загруженности процессора. Больше в голову ничего иного не приходит.

anonymous
()

А файлов у тебя никто не создает немерянное количество? Если они в /tmp, то система стирает их при перезагрузке и ты их не увидишь потом, правда могут быть сообщения о нехватки инодов в логе?! Или процессов много, когда уже форкаться некуда - то, что консоли перключаются, а логина нет, как раз об этом и говорит!

Но на всякий случай - что мешает попробовать 2.2.19 (оно очень стабильно под нагрузкой, хотя и не самое быстрое) от той же сусе взятое, например из дистрибутива 7.1, который еще активно поддерживается (ядро обновляется) и имеет туже процедуру загрузки, что и 6.3?!

anonymous
()

Да файлы создаются, но только в var (сам раздел большой), никаких ошибок не обнаружено на нехватку inodes.
Сегодня с утра на некоторых машинах поставил 2.2.19 из обновлений для SuSE 6.3 - буду смотреть (жаль поддержка для 6.3 прекращена).

А если поставить ядро из ветки 2.4 - много ли пакетов придется обновлять?



anonymous
()

Да файлы создаются, но только в var (сам раздел большой), никаких ошибок не обнаружено на нехватку inodes.
Сегодня с утра на некоторых машинах поставил 2.2.19 из обновлений для SuSE 6.3 - буду смотреть (жаль поддержка для 6.3 прекращена).

А если поставить ядро из ветки 2.4 - много ли пакетов придется обновлять?




eugenes
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.