LINUX.ORG.RU
ФорумAdmin

Сломался внезапно Debian

 , ,


1

1

Уважаемые форумчане, кто может поделиться яркими примерами, когда работающая standalone нода с Debian+Mysql+nginx+php-fpm,в самой примитивной конфигурации домашнего десктопа,которая не обновляется, и предположим не доступна из интернета и используется только в интрасети, но тем не менее поломалась, и не в следствие аппаратного сбоя, а по причине софтового сбоя.

Тема не ради холивара,а интересны сами траблшутинги в таких случаях,к примеру проявление какого-то системного или прикладного бага по стечению благоприятных обстоятельств и тд, а так же есть ли аргументы для кластеризации, даже в таких случаях дабы повысить только отказоустойчивость и доступность сервиса.



Последнее исправление: keyti (всего исправлений: 1)

stand a lone

standalone

громотей!

bvn13 ★★★★★
()
Ответ на: комментарий от keyti

используется только в интрасети

Даже если так - может получить гадость (не обновляется же, а CVE обновляются), от уже зараженного (ботнетом, примером, или Петей каким-то) другого компа в интрасети, который соот-нно доступ имеет.

Или может проявится баг которому, вот специфические условия надо, и вот они появились условия-то. Примером может стать MySql

Отвалился RAID (если RAID) или другой NAS/smb/etc… Или в общем с сетью трабл.

Ну и кто-то решил протестировать уязвимость сервиса, соот-нно без предупреждения, и сделал что-то плохое, потому что XSS атака прошла (какая неожиданность).

i3wm
()

не используй систямд и ничего не упадет

anonymous
()

и не в следствие аппаратного сбоя, а по причине софтового сбоя.

IMHO, вероятность первого события гораздо выше, чем вероятность наступления второго. Кластеризацией обычно защищаются именно от аппаратных сбоев.

Serge10 ★★★★★
()

Никогда не ломалось просто так. Разве что после обновления.

turtle_bazon ★★★★★
()
Ответ на: комментарий от i3wm

Спасибо! Насчёт CVE вполне реальный сценарий,но когда я начал говорить о нём,то это сочли забавной фантастикой

keyti
() автор топика
Ответ на: комментарий от Serge10

не помню сейчас к сожалению деталей, но помню была бага у апач,когда при больших нагрузках память текла, нашли ее гораздо позже, но как временное решение спасла именно кластеризация.

keyti
() автор топика
Ответ на: комментарий от darkenshvein

ну софт от MS это вообще отдельная песня Но IMHO,если талантливый человек с хорошим бэкраундом в этом направление, захочет это, то очень даже вероятно, что крякнут))

keyti
() автор топика

Нефиг вообще ожидать, что что-то будет надёжно работать; есть мириады причин, по которым что-то может сломаться, стабильность достигается лишь устранением самых заметных и счастливым стечением обстоятельств.

К твоему сведению, даже компьютерное железо не является 100%-но надёжным. Процессоры, например, регулярно допускают ошибки из-за случайных флуктаций, типа мимо пролетевшего нейтрино. Чтобы минимизировать их влияние, используется мажоритарное голосование: элементы процессора продублированы по три штуки, один сбойнёт – два остальных выдадут правильный результат. Вероятность сбоя падает на порядки, но всё равно произойти он может, если не повезёт.

О дисках и говорить нечего, там контроль целостности гарантируется контрольными суммами, которые чисто случайно могут совпасть с испорченными данными – мизерно редко, но вот вдруг.

А в софте багов просто дохренища, это базовое свойство фон-неймановских машин, их стабильность математически недоказуема, нельзя даже однозначно математически доказать, зависнет ли простейшая программа или нет; а представь какой бардак творится в больших программах, и помножь их на квалификацию программистов.

Суть Debian Stable, кстати, вовсе не в магически достигаемой безглючности. Просто, во-первых, там не обновляются версии до следующего релиза, так что если какую-то программу заморозили с глюками – она так и будет с глюками. Программы с критичными глюками выкидывают нафиг из репозитория, или, если программа ну очень нужная – откладывают до их починки релиз. Остальные выявленные глюки тупо документируют (ты читал документацию по всем установленным пакетам? то-то же!)

anonymous
()
Ответ на: комментарий от anonymous

Плюсану. Очень правильно все описано. Да и выше i3wm также все верно описал.
От себя добавлю есть ещё такой хардверный баг «электрики». И вот с с этим багом тоже может возникнуть как писал во втором посте bdfy silent corruption.

anc ★★★★★
()
Ответ на: комментарий от anonymous

Так я пытаюсь донести до руководства, что кластеризация это необходимость для нормального HA/HL, пуст. даже пока без Hihg Load, но у нас разработчик, который уверяет в нашем случае нода будет работать долго(почти вечно) и идеально, я пытался привести здешние доводы, но в ответ только смех, и я мол фантазер

keyti
() автор топика
Ответ на: комментарий от anonymous

Вообщем пока в печали и в апатии уже, не знаю как еще объяснить что это реально получить недоступный сервис

keyti
() автор топика
Ответ на: комментарий от keyti

Не надо ничего переводить.

Если они наивные фантазёры, которые думают, что у них SLA 100% будет и хрен чё когда поломается, то вежливо ткни носом в понятие SLA и как с ним у серьёзных контор дело обстоит.

Если им на самом деле пофиг, то не лезь не в своё дело, оно тебе надо — лишний головняк требовать на свою голову? Если сломается, а ты админ, то тебе же лучше только — сможешь премию требовать за героическую подымку прода в три часа ночи ;-)

anonymous
()
Ответ на: комментарий от anonymous

Согласен,так меньше усилий и больше пользы))

keyti
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.