LINUX.ORG.RU
ФорумTalks

Прозрение Штульмана

 ,


1

2

Штульман повзрослел, стал на год взрослее.

А было вот что.

Я последний год внедрял в нашей конторке всякие штуки, то Proxmox вместо пиратской VMWare, то Let’Encript, то собственное облако, то мониторинг, то настаивал на необходимости оповещений о значительный отвалах сервиса, то продвигал идею обезличивания одной ИС, которая ела кучу денег на защиту, но при этом совершенно неоправданно.

Чем все кончилось.

Не далее чем вчера, зашел на наш main_router и добавил на него правило. Отвалилась консоль и интернет в офисе.

Ну что же, старшему коллеге объяснил, что мол добавлял сервис SNMP и хотел ограничить доступ к нему только локалкой. Добавил правило, указал порт, но не указал протокол, применил; после чего отпало управление и интернет в офисе. Все по честноку, это вообще мой принцип.

Ну что же, на то чтобы прошить микротик прошивкой из архива месячной давности у коллеги ушло 8 часов. За это время всем коллегам была внедрена мысль что сделал все это я специально, что это саботаж.

Через час после инцидента, мне позвонила босс: «ну что у нас?». Я сказал: «добавлял сервис SNMP и хотел ограничить доступ к нему только локалкой. Добавил правило, указал порт, но не указал протокол, применил; после чего отпало управление и интернет в офисе», что для босса прозвучало «ДАОШРвЫДШоарфыдвтфмдоывамтдошукфитфткмдфгшукмтгшдффжщукшпомтжкф, я все сломал»

Утром мне сказали что теперь микротик будут администрировать столько с ее ведома, что все её одинесники сказали что лезть в микротик нельзя.

Я перечислил ей другие случаи глобальных сбоев: «аттестованная сертифицированная контора разослала на випнеты наших клиентов пустой список IP координаторов, время полного восстановления 180 дней», «внедрили линукс, наш главный одинесник 2 недели доказывал что линукс глючный и не может как винда, при этом клиенты почти не могли работать, после выделения серверу необходимых ресурсов работа нормализовалась», «наш главный одинесник пил 3 месяца – данный опыт бесценен».

Никто не говорил о саботаже.

Да похоже даже в глазах коллег я всего лишь мальчик который носит трубку и соединяет с «Викой».

А какой у тебя был факап, после которого ты потерял всю репутацию?

PS. Да, в этот раз, похоже действительно пора увольняться.



Последнее исправление: Shulman (всего исправлений: 1)
Ответ на: комментарий от TDrive

Скорее всего я этот доклад смотрел.

Типичный троллейбус из хлебушка, если не ошибаюсь.

Так-то уже давно есть cloud native хранилища, но они концептуально иначе чем постгрес устроены.

WitcherGeralt ★★
()
Ответ на: комментарий от EugeneBas

Я не очень люблю объяснять очевидные вещи. Так что предлагаю зайти с другой стороны.

Если расскажешь как у тебя при этом устроены бекапы, репликация и фоллбек, скорее всего, сам поймёшь.

WitcherGeralt ★★
()
Ответ на: комментарий от zgen

нет, он не виноват, сама постановка вопроса о чьей-либо вине в корне не верна. это естественные рабочие процессы, без которых никак не обойтись. вместо того, чтобы такого не допускать впредь, мы тычим пальцем и ищем виновного. и что? легче стало? да, коллектив говно, если они уже начали придумывать версии о саботаже, лол.

человек и так осознал свою ошибку, он сам себя наказал и хочет исправить ситуацию. вместо того, чтобы помочь ему снять напряжение, не загоняться, работать и двигаться дальше — тычут пальцем. ну говно, не люди.

Spoofing ★★★★★
()
Последнее исправление: Spoofing (всего исправлений: 1)
Ответ на: комментарий от Spoofing

сама постановка вопроса о чьей-либо вине в корне не верна

Что в ней неверного?

чтобы такого не допускать впредь

Установление ответственного за факап это часть именно этого процесса.

ya-betmen ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Типичный троллейбус из хлебушка, если не ошибаюсь.

Так можно сказать про все что угодно чего не понимаешь)

Если упарываться кубером то смысл есть, но это должно быть хорошо обдуманное решение.

TDrive ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Я не очень люблю объяснять очевидные вещи. Так что предлагаю зайти с другой стороны.

В прошлом треде я тебе объяснял как make работает, а ты тут выпендриваешься. лол

TDrive ★★★★★
()
Ответ на: комментарий от ya-betmen

понимаете, для меня это больная тема, меня это тоже касается.

мой недавний косяк на работе, я вставил два разных процессора 2680v2 и 2690v2 в один gen8 сервер, ЧСХ, сервер запустился, и не выдал никакой ошибки при инициализации, а я даже не обратил внимание, что процессоры разные — ну в шары долблюсь, бывает, знаю свои недостатки. счастье, что сервер не ушёл клиенту, я сам себя дважды контролирую и пишу на бумажке, что я собираю. старший коллега смотрит, что-то не то записано, и давай проверять, обнаружил, что стоит не тот проц. слова мне не сказал, мою ошибку мы исправили.

если бы мне сделали замечание — легче бы мне стало? нет.

а вчера мы отправили крупный заказ, 70 деллов, я лично собирал, каждый проверял. и знаешь что? ни одной ошибки не допустил. сервера в отличном состоянии. хотя масштаб и вероятность допустить ошибку несоизмеримо больше, чем один зассанный сервер с разными процами.

так что... надо просто работать. а не указывать на ошибки, о которых человек и так в курсе по факту их, ошибок, обнаружения.

я человек очень ответственный, очень пунктуальный, тоже бывает ошибаюсь и карю себя за это, но от того что меня потом ещё будут тыкать в это — лучше мне от этого не станет.

по этой причине, когда кто-то ошибается, я стараюсь разрядить обстановку и молча решаю проблему. а не вот это вот всё говно с переводом стрелок и установкой крайнего.

Spoofing ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Ты там заявил

Чего у тебя там мейк отслеживает помимо существования целей?

Человек который знает что мейк смотрит время изменения файлов такой хрени не спросит)

TDrive ★★★★★
()
Ответ на: комментарий от TDrive

это лишь значит человек ниразу не устанавливал сорц-базед дистрибутив, и в процессе обновления системы из сорцов, ниразу параллельно не занимался настройкой системы — не запускал ntpdate -u pool.ntp.org. :)

Spoofing ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Мейк считает файл изменившимся, если его время модификации позже времени модификации файла-цели. В содержимое файла он не смотрит, это накладно по ресурсозатратам.

Harald ★★★★★
()
Ответ на: комментарий от Spoofing

вот всё говно с переводом стрелок и установкой крайнего.

Эм, уточни чисто для себя что означает «переводить стрелки».

Коллега знает виноватого? Знает. Ты согласен что твой косяк? Согласен. Поиск виновного у вас там уже произошёл, а что с этими знаниями делать вопрос десятый.

ya-betmen ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Мы обсуждали системы сборки) о каком же отслеживании изменений в файлах я мог говорить?) Прям задача тысячилетия, зовите Перельмана.

TDrive ★★★★★
()
Ответ на: комментарий от EugeneBas

когда это БД в докере стала моветоном?

Правильный вопрос - когда перестала? а правильный ответ - а в каком дистре?

ya-betmen ★★★★★
()
Последнее исправление: ya-betmen (всего исправлений: 1)
Ответ на: комментарий от TDrive

И кто тут шланг? Ты сначала упоролся и докопался до прямой и чистейшей аналогии, а тут, значит, ну никак не мог ляпнуть упоротую дичь, а обязан был понять, что ты не подразумеваешь то, что пишешь.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)

А какой у тебя был факап

Самое ужасное было - убил боевой RAID-5 на железном контроллере.

Главное так и не знаю как именно. Один диск из пяти дал сбой. Сервер премерзко пищал. Дело было ночью, я там в серверной ваял что-то другое на другом сервере, поэтому нервничал от постороннего писка. Отключил, вынул больной диск и на его место воткнул другой из рабочего массива. Видимо была мысль проверить - не корзина и её слот ли тупит. Включил и ... весь RAID-5 инициализировался в ноль. Видимо получилось, что одного диска нет вообще, а в его слоте контроллер обнаружил диск из соседнего слота и не опознал его. Вот оно без двух дисков и обнулилось.

Восстановил, конечно. Но трындец как стыдно во-первых. А во-вторых больше никогда RAID-5 не использовал. Очень страшный зверь.

Я бы себя не просто уволил, ещё бы и под трибунал отдал, возможно. Однако никаких санкций от руководства не было. Кажется я сам себя сильнее изнутри загрыз, чем люди вообще поняли что это было.

Давняя история. Заставляю себя её вспоминать, когда начинает казаться, что я слишком красивый красавец так-то.

Toxo2 ★★★★
()
Ответ на: комментарий от WitcherGeralt

И кто тут шланг? Ты сначала упоролся и докопался до прямой и чистейшей аналогии,

Давай спросим)

Господа кто считает что make это «прямой и чистейший» аналог npm или yarn?

TDrive ★★★★★
()
Ответ на: комментарий от Spoofing

я, конечно, рад, что ты работаешь с понями, но

я сам себя дважды контролирую и пишу на бумажке

особенно помогают бумажке при попытке быстро что-то найти или автоматизировать проверку

я сам себя дважды контролирую
старший коллега смотрит, что-то не то записано, и давай проверять

ну то есть толку от твоего двойного самоконтроля хрен да нихера пока старший товарищ не придет

старший коллега
слова мне не сказал

либо он даже и не пытается перевести тебя из разряда младших коллег в просто коллеги, либо на тебя уже махнули рукой, это, мол, тот пришибленный, что с него взять.

потому что откуда ты знаешь, что ты

ни одной ошибки не допустил

если ты все так же

лично собирал, каждый проверял

а старший коллега все не перепроверил?

ну то есть как из твоей ситуации, где тебе ничего сказали и ошибку не разобрали, вы собираетесь добиваться

того, чтобы такого не допускать впредь?

seras
()
Последнее исправление: seras (всего исправлений: 1)
Ответ на: комментарий от TDrive

Нет, а ты конченый.

Давай на пальцах, специально для беспросветно тупорылых.

Если перейдёшь по ссылке, то обраружишь, что сишник там предлагает выполнить команду make. Я объясняю сишнику, проводя доступную ему аналогию, что проект на JS и вместо мейкфайла сборка описана в package.json, а вместо make вызвать нужно будет yarn или npm.

WitcherGeralt ★★
()
Ответ на: комментарий от WitcherGeralt

Давай на пальцах, специально для беспросветно тупорылых.

Держи себя в руках) Крутишся как уж на сковороде.

TDrive ★★★★★
()
Ответ на: комментарий от Spoofing

я сам себя дважды контролирую и пишу на бумажке, что я собираю

В твоём случе надо не только что собираешь описывать, но и чеклист сделать для проверок.

Важно не только проверять что сделано, но и проверять что не сделано или чего не должно быть.

И например по итогам ретроспективы внести туда пункт «Модель процессоров одинаковая» и т.п. И потом уже с таким чек-листом можно просто по списку все галочки поотмечать и быть спокойным.

alpha ★★★★★
()
Ответ на: комментарий от TDrive

Теперь я опять сомневаюсь конченый ты, или просто целенаправленно пытаешься меня выбесить.

Крутишся как уж на сковороде

Опровергай или иди лесом.

Ты либо альтернативно одарён в области чтения, либо уже назло играешь в барана.

WitcherGeralt ★★
()
Ответ на: комментарий от fernandos

Ну так оно же и есть саботаж!!! Во имя SNMP никому нинужного и в короткой перспективе он стопанул критические бизнес процессы. Именно такое называется саботаж.

Jetty ★★★★★
()
Ответ на: комментарий от rupert

Вопрос в тому нужна ли комуто его «работа»... Знаю таких работничков :)

Jetty ★★★★★
()
Ответ на: комментарий от dimgel

Так а какая-такая ключевая фича распоследней постгри тебе надо? Я чейнджлог смотрел вродь там ничегошеньки нового из фичей.

Jetty ★★★★★
()
Ответ на: комментарий от WitcherGeralt

То есть ты в разговоре о системах сборки на фразу «make отслеживает изменения файлов» подумал про версионирование, а теперь называешь меня альтернативно одаренным…

что еще мне тут нужно опровергать?))

TDrive ★★★★★
()

Не далее чем вчера, зашел на наш main_router и добавил на него правило. Отвалилась консоль и интернет в офисе.

Надо сначала было иметь виртуальный роутер или ВМ-ку на которой крутилась бы полный клон ОС роутера и всех настроек, в этой ВМ-ке и проверил бы правило. А так ты поступил как обычный простофиля.

linuxoidspb
()
Ответ на: комментарий от Jetty

А что вы понимаете под саботажем? Для того чтобы назвать его действия саботажем в общеупотребительном смысле нужно установить факт умысла на остановку бизнесс-процессов

cobold ★★★★★
()
Ответ на: комментарий от TDrive

Опять резко тему сменил, найс. Донный демагог.

подумал про версионирование

Подумал, что ты неадекват, от которого неизвестно что ожидать. И не ошибся, как показывает практика.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)
Ответ на: комментарий от WitcherGeralt

Опять резко тему сменил, найс. Донный демагог.

Второй тред одно и то же обсуждаем а тебе какие то смены темы мерещутся.

TDrive ★★★★★
()
Ответ на: комментарий от Spoofing

нет, он не виноват

Воу-воу

человек и так осознал свою ошибку

Он не мог осознать свою ошибку, потому что он не виноват, а значит не ошибался.

Есть действие, есть последствия и есть тот кто эти действия предпринял. Ты как ни ставь вопрос, фактов это не изменит.

вместо того, чтобы такого не допускать впредь,

По-моему отлично сделали - запретили виновному трогать важное оборудование в принципе. Проблема решена.

человек и так осознал свою ошибку, он сам себя наказал и хочет исправить ситуацию.

ну хз, 8 часов кто-то там ****ся. Для того чтобы 1 правила маскарада с внутренних интерфейсов во внешние воткнуть?

Где же был автор? Почему не помог?

вместо того, чтобы помочь ему снять напряжение

Нельзя снять напряжение, которое генеруется снаружи (пользователями которые не могут работать по твоей вине), а не изнутри. Это не джакузи, не массажный салон. Если бы он сам сломал и сам починил быстро, то внешнего напряжения не было бы, а коллеги бы поржали и сказали что «с кем не бывает, это норм».

А всё навернуть и скинуть ответственность за восстановление на коллегу - это самое дебильное и скотское поведение. С *** его еще жалеть при этом?

zgen ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Подумал, что ты неадекват, от которого неизвестно что ожидать. И не ошибся, как показывает практика.

То есть ты начал тупить как дуб каких поискать потому что подумал что я неадекват…

Ясно. Понятно. Больше мне тут сказать нечего.

TDrive ★★★★★
()
Ответ на: комментарий от Spoofing

слова мне не сказал, мою ошибку мы исправили.

Потому что ты не испортил работу хрен знает скольки людям.
Есть все же разница, прислал не то оборудование или ***ул весь рабочий процесс


тоже бывает ошибаюсь

У каждой ошибки есть фамилия. И что с этим делать - зависит от последствий ошибки. Не надо всё валить в одну кучу, будто нет разницы.

Вот Чернобыль на***ся. Подумаешь, ну инженер ошибся, бывает. Ерунда какая, давайте не будем его ругать.

zgen ★★★★★
()
Ответ на: комментарий от Spoofing

это лишь значит человек ниразу не устанавливал сорц-базед дистрибутив,

Это значит что человек в принципе никогда не запускал make

zgen ★★★★★
()
Ответ на: комментарий от zgen

Я так понял он удаленный админ. Когда навернулся удаленный доступ к роутеру он его никак удаленно не починит. Нужен человек с физическим доступом к железке

cobold ★★★★★
()
Ответ на: комментарий от cobold

нужно установить факт умысла

++ а умысла всё сломать не было

zgen ★★★★★
()
Ответ на: комментарий от TDrive

Сам докопался до аналогии, поняв написанное предельно буквально, а потом возмущаешься, что тебя понимают буквально, когда ты собираешься мейком «отслеживать изменения в файлах». Красотища прям.

WitcherGeralt ★★
()
Ответ на: комментарий от rupert

Ну да, какие-нибудь сейлы чего-нить не продали, денег не получили, ипотеку не заплатили.

Одна радость. У нас тут в дефолт-сити нынче выходных вагон, бизнес и так не знает, где деньги брать чтобы их оплачивать, а тут такой подгон.

zgen ★★★★★
()
Ответ на: комментарий от WitcherGeralt

Так он буквально и отслеживает изменения в файлах, смотрит какие файлы изменились с помошью времени последнего изменения.

Какой невероятный ход мыслей привел тебя к идеи о том что мейк занимается контролем версий?

TDrive ★★★★★
()
Ответ на: комментарий от cobold

Если он удаленный админ, тогда ему в принципе н***й делать на роутере обеспечивающим не дублированный доступ без плана Б. Ну вот реально. Даже с***ка нажать backup в микроте перед твоими изменениями - секундная операция. И время на восстановление исчислялось бы единицами минут.

Даже если ты удаленный админ, то ты можешь _по крайней мере_ предложить помощь в устранении факапа который ты же создал, потому что ТЫ что-то делал, и ТЫ точно знаешь что нужно сделать, чтобы эти изменения отменить.

zgen ★★★★★
()
Ответ на: комментарий от TDrive

Изменение времени я вообще в расчёт не брал, оно не имеет отношения к изменению содержимого файлов. А «изменения в файлах» это как раз содержимое. Предположений каким чудом это происходит и что ты имел ввиду я строить не пытался, а сразу спросил.

К тому же я никогда не перечислял исходников в зависимостях к целям. И понятия не имею насколько это распространённая практика, если говорить о рукописных мейкфайлах. У меня зависимости всегда генерируются предыдущими целями в цепочке. Ну, то есть, время в моём типичном сценарии вообще не релевантно (не буду же я специально в произвольном порядке шаги запускать) и я никак не мог о нём подумать, когда речь шла об «изменения в файлах».

Тем паче, что, стартовав тот тред, ты сначала проявил фееричный шелдонизм, а потом внезапно формулировки у тебя же самого стали неточными. Давай уж, если гнёшь линию аутиста, гни её до конца. Следуй правилу наименьшей неожиданности.

WitcherGeralt ★★
()
Последнее исправление: WitcherGeralt (всего исправлений: 1)

В свою бытность админом много дров наломал конечно. Самое лютое - это когда вызвали к стенографисткам, а там комп банально не запускается. Ошибка SMART. Я как самый криворукий дегенерат просто отключил её в BIOS и пошел дальше. Через неделю винт превратился в решето. Меня повозили носом по ковру и заставили поставить туда свою рабочую машину и перетащить туда их софт. Данных критических там быть не могло, потому что они с сервером работают, но вот репутация тогда пострадала. Машину мою потом вернули конечно, когда с винтом разобрались. Потому что нужна целая туча бумажек чтобы перетащить комп с одного управление в другое.

spoilt ★★★
()
Ответ на: комментарий от spoilt

у тебя пострадал один пользовать, а не весь офис или несколько

zgen ★★★★★
()

Для таких ситуаций safe mode в mikrotik и придуман. Отрубил себе доступ - потерял соединение, тик автоматически откатил изменения на момент до включения безопасного режима.

на то чтобы прошить микротик прошивкой из архива месячной давности у коллеги ушло 8 часов.

Коллега тоже микротик впервые видит, или за месяц много изменений произошло? И вообще, почему из бэкапа пришлось откатывать? Консольного порта на тике нет?

Утром мне сказали что теперь микротик будут администрировать столько с ее ведома, что все её одинесники сказали что лезть в микротик нельзя.

Логично. Для неё проблема это когда сервис недоступен сотрудникам 8 часов. А то, что у неё SNMP отсутствует — не её проблема, у неё, как она думала, есть 2 мальчика, которые руками могут настроить оборудование. И вот она выяснила, что самостоятельно они этого сделать не могут, поэтому она хочет управлять процессом.
1Сники тоже верно сказали: «к проду необученный персонал подпускать нельзя».

А какой у тебя был факап, после которого ты потерял всю репутацию?
Штульман повзрослел

Выходит, что нет. Неправильные выводы ты сделал.

Да похоже даже в глазах коллег я всего лишь мальчик который носит рубку и соединяет с «Викой».

Вот это хорошо. Это прозрение. Вся твоя «репутация», которую ты «потерял» — она только в твоей голове, или в головах других, кто знает про snmp, линуксы и т.п.

В глазах нормальных людей ты из «мальчика который принтер чинит» превратишься в ценного специалиста, когда научишься решать их проблемы и не создавать лишних. И то не факт. Эникейщика aka «сисадмин офисный обыкновенный» они никогда уважать не будут, потому что ворд у них и дома работает. Почему для этого на работе нужен отдельный сотрудник?

Чтобы человек смог оценить твою работу, он должен быть готов принять твои услуги. У тебя директриса не готова. Но не потому что она дура (управлять предприятием — это тебе не файервол удалённо настраивать), возможно, просто ты не подготовил её к этому. Это ты решил, что на предприятии нужен SNMP. Не спросив ни у кого пошёл внедрять. И облажался. Обсуди ты с руководством этот вопрос заранее, и они бы готовы были к факапу, и ты меньше мест бы себе оставил для ошибки, т.к. директор бы задала правильные вопросы, и ты бы, гугля ответы на них, про тот же safe mode прочитал, прежде чем конфигурять.

Так что, фактически выходит, что это саботаж. На предприятии «всё работало» и так, а ты на ровном месте решил им даунтайм в 8 часов организовать.

mogwai ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.