Вчера вечером, после 272 суток беспроблемного аптайма перестал отзываться http://www.aviaport.ru. Пинг идёт, по ssh и через http недоступен. IP-KVM встроенный там старый и глючный, так что я написал хостеру, мол, гляньте, что там. Хостер ответил в духе «при подключении консоли видно окошко логина», типа, с виду как живой. Попросил перезагрузить — римский полководец Нолемоций. Пока шум да дело (уже начал просить их подключить их IP-KVM), сумел подцепиться со своим девайсом.
Вижу, машина висит на BIOS «Error, press F1». Обнаружила, что BMC не отзывается (удалённая консоль). Ну, чёрт с ним, не до жиру, разбираться некогда, перезагружаю. Вроде, всё ок. Стартует, работает. Ладно, мало ли, единичный глюк.
Через несколько часов снова та же фигня, машина пингуется, но никак не доступна. Ок, теперь есть доступ к машине в таком состоянии, лезу ковыряться.
С виду, реально, как живой. В логах и dmesg всё корректно, сеть поднята. Но даже GW не пингуется. (локальный IP пингуется). Рестарт сетевого интерфейсас не помогает. Поднимается нормально, но ничего не работает. Перезагружаю — на старте снова BMC Error. Ок, выключаю в BIOS паузу на ошибке, вырубаю машину, пишу хостеру, чтобы обесточили полностью. Мало ли, BMC завис и от него глюки? Всё же, общий сетевой интерфейс с машиной.
Обесточили, пару минут подержали, включили. Смотрю по состоянию — всё ок, BMC заработал, всё прекрасно. Ну, думаю, буду надеяться, что всё будет ок. Ложусь спать, наконец. Тем более, что ещё прошлой ночью только 4 часа спал :)
Проходит 2.5 часа (уже утро) с работы звонят «сайт снова недоступен». Июать! Лезу через IP-KVM, всё как всегда. С виду всё прекрасно, в логах чистота (не считая ругани postfix на недоступность сети и т.п.), в списке процессов никакого криминала. Перезагружаюсь мягко по reboot — всё прекрасно работает.
Включил сейчас вывод на экран логов syslog, dmesg, top, htop. Как снова заглючит, посмотрю на чём оборвётся. В munin никакого криминала, тоже с виду всё ок: http://home.balancer.ru/munin/aviaport/aviaport/index.html
Добавил в 1-минутный cron рестарт, как только перестанет пинговаться шлюз (надеюсь, ложных срабатываний не будет). Пока ожидается следующий завис, иду спать.
Ядро до зависа было старое, после первого рестарта обновилось до 3.10.7 (обновля 7 сентября, но не перезагружался). Т.е. от версии ядра глюк не зависит.
Gentoo.
Есть мысли, что это за нафиг?
Ответ на:
комментарий
от blind_oracle
Ответ на:
комментарий
от Deleted
Ответ на:
комментарий
от KRoN73
Ответ на:
комментарий
от KRoN73
Ответ на:
комментарий
от blind_oracle
Ответ на:
комментарий
от vel
Ответ на:
комментарий
от KRoN73
Ответ на:
комментарий
от vel
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.
Похожие темы
- Форум Коллективный разум (2008)
- Форум LVM vs MDADM. Нужна помощь коллективного разума. (2014)
- Форум [Коллективный разум] Видео наблюдение (2010)
- Форум [LOROutsession][природа]Коллективный разум (2008)
- Форум [Коллективный разум] [Студентота, диплом] Виртуализация (2010)
- Форум норберт винер и коллективный разум (2013)
- Форум Привет, телепатия и коллективный разум. (2013)
- Форум [коллективному разуму] лампы дневного света (2010)
- Форум [вопрос коллективному разуму] ISP Skynet (2009)
- Форум [parse pdf][brainstorm] нужен коллективный разум (2010)