LINUX.ORG.RU
ФорумTalks

система ведения и анализа событий


0

0


не знаю, как и назвать то её так что назову, как в указано выше.

собственно хочется некую систему, в которой можно было бы вести трек происходящих во времени событий. цель - сбор информации с целью её последующего анализа.

ну вот, допустим, примерный use case: у нас навернулся сервак или какой-то сервис стал сбоить или что-то в целом пошло не так, как планировалось.

возникает логичный вопрос: почему? вариантов может быть масса, т.к. на поведение сервиса могут влиять многие внешние факторы a'la обновления ПО, железа, конфигурации, скачки нагрузки и ещё бог знает что. опять же, субъектов, которые своими действиями могут повлиять на работу сервиса, может быть много. не всегда они доступны в реальном времени, не всегда все они помнят, что и когда они делали и пр. и пр.

в общем, разворачивать событийную цепочку из массы ниточек бОльшая часть из которых порвана а некоторые просто ложные - дело неблагодарное. а если система состоит из десятков серверов и сервисов, кучи народу, тасков и пр. и отношения между которыми могут быть достаточно сложными? без какого-то упорядоченного логирования операций причем в первую очередь человеком это дело становится практически невыполнимым.

замечу, я не говорю про багтрекинг или, допустим, планер. я имею ввиду несколько иное. допустим, делает Вася какое-то действие, обновляет ПО, рестартует сервис, вносит новую функциональность - в общем все, отличное от сходить в туалет? зашел в систему и занес своё действие. такого-то такого-то Вася обновлял ПО. а такого-то Петя рестартовал все нафик. а тогда-то было то-то и тд и тп. чтобы в час X у меня под руками хотя бы было некое видение того, что у нас происходило по тем или иным объектам, в тех или иных категориях.

ну собственно конкретные ТТХ приводить не буду, начнем с общего подхода. a'la как такие штуки зовутся и куда вообще копать.

// wbr


ps: да, конечно, можно все тупо писать в вики. но это - каменный век. мягко говоря.

// wbr

klalafuda ★☆☆
() автор топика

т.е. SCADA(DCS) система для серверов?

а там всякие zabbix и nagios таокго не позволяют

python + zenoss

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

> т.е. SCADA(DCS) система для серверов?
> а там всякие zabbix и nagios таокго не позволяют

не для серверов - для людей :) zabbix или nagios - это IMHO всё-таки из другой области. мониторинг сервисов - это их. но вот ведение произвольных событий в свободной форме - AFAIU нет.

// wbr

klalafuda ★☆☆
() автор топика

>в общем, разворачивать событийную цепочку из массы ниточек бОльшая часть из которых порвана а некоторые просто ложные - дело неблагодарное. а если система состоит из десятков серверов и сервисов, кучи народу, тасков и пр. и отношения между которыми могут быть достаточно сложными?

для этого есть всякие ITIL и прочие методики, которые гарантируют, что такого хаоса не случается если им следовать

p.s. там для всякие ERP есть система операционного планирования и учёта, по-моему это всё туда относится

dimon555 ★★★★★
()

> как такие штуки зовутся и куда вообще копать.

ERP. Они же "Комплексная автоматизация" "внутренних [бизнес]процессов". Копать в сторону Microsoft Navision + должностные инструкции... xDD

LamerOk ★★★★★
()
Ответ на: комментарий от dimon555

> в принципе datamining можно назвать

нет, ну это не совсем DM то, что я хочу :) сбор и анализ данных все равно ручной. но статься о DM на википедии натолкнула меня на другие полезные мысли, спасибо.

// wbr

klalafuda ★☆☆
() автор топика
Ответ на: комментарий от klalafuda

>сбор и анализ данных все равно ручной

после этого вики - вершина прогресса :)

нужно сформулировать анкетку с вопросами: что я хочу и что есть сейчас, как-то так

dimon555 ★★★★★
()
Ответ на: комментарий от LamerOk

>Копать в сторону Microsoft Navision

если хочется чисто круто за большое бабло, то есть My sap erp
а так по простому: любой фреймворк или сервер приложений подойдёт

а описывать эти бизнес-процессы, потом пытаться надыбать лучшие практики лидера или искать чего там можно автоматизировать... но конечно понимать что ты делаешь и как этим управляешь очень полезно для дела.

dimon555 ★★★★★
()
Ответ на: комментарий от dimon555

> после этого вики - вершина прогресса :)
> нужно сформулировать анкетку с вопросами: что я хочу и что есть сейчас, как-то так

вики - это вики. собранные данные нужно как-то группировать и сортировать по набору срезов, причем в контексте заданной модели системы. соотв. должна быть достаточно гибкая система построения моделей и иерархий разнообразных объектов. "в дц жил сервер на сервере жил сервис на сервисе жил баг в доме который построил джек". что мне толку от нескольких сотен/тысяч записей на листиках что мол что-то там произошло? я же умру их анализировать. ну хорошо, пусть даже с расставленными тэгами как средство группировки событий. помимо модели система должна позволять строить разнообразные представления данных, вьюшки, по заданным критериям. ну не знаю, где-то так.

// wbr

klalafuda ★☆☆
() автор топика

Думаю стоит почитать про системы Root cause analysis (RCA).

Вот только реализации универсальной, т.е. под любое окружение, быть в принципе не может...

То что в примере описано: для этого, к примеру, emc smarts.

Опенсорцевых не знаю.

Bebop ★★
()
Ответ на: комментарий от dimon555

> если хочется чисто круто за большое бабло

Я указал не то, что за большое бабло, а то, что мало мальски используется для данной задачи.

> а описывать эти бизнес-процессы

В данном случае, не "бизнес", а технические и организационные. Но описывать в любом случае придется, libtelepathy пока еще слабо развита. Но описывать - это цветочки. Ягодки будут на внедрении.

LamerOk ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.