LINUX.ORG.RU
решено ФорумAdmin

NAGIOS Удаленный мониторинг GPU, MEMORY, SWAP по SSH

 ,


0

1

Добрый вечер.

*** CentOS *** Nagios ***

Сервер Nagios и клиент Nagios - CentOS 6

Доступ через интернет по SSH по ключам от сервера к клиенту для Nagios настроен, плагины на клиенте установлены. Некоторый проверки по SSH работают корректно, например проверка дискового пространства, проверка сервера-MySql.

Не получается мониторить через интернет по SSH удаленный сервер на предмет: GPU, MEMORY, SWAP

SWAP:

# SWAP
define command{
        command_name    check_ssh_swap
        command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C «/home/nagios/plugins/check_swap -w $ARG1$ -c $ARG2$»
}

# SWAP
define service{
        use                             local-service      
        host_name                       my-host 
        service_description             SWAP
        check_command                   check_ssh_swap!20!10 
}
Результат:
CRITICAL	SWAP CRITICAL - 100% free (0 MB out of 0 MB) 
хотя в реали SWAP - 2%

GPU, MEMORY:

# GPU + MEMORY
define command{
        command_name    check_ssh_nt
        command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C «/home/nagios/plugins/check_nt -H $HOSTADDRESS$ -v $ARG1$ $ARG2$»
}

# GPU
define service{
        use                             local-service 
        host_name                       my-host 
        service_description             GPU
        check_command                   check_ssh_nt!CPULOAD!-l 5,80,90
}

# MEMORY
define service{
        use                             local-service        
        host_name                       my-host      
        service_description             MEMORY
        check_command                   check_ssh_nt!MEMUSE!-w 80 -c 90
}
Результат:
# GPU
CRITICAL	Connection refused 
# MEMORY
CRITICAL	Connection refused

Подскажите в чем может быть причина того, что в SWAP - ложные данные, а в GPU и MEMORY - соединение отклонено?

Спасибо.



Последнее исправление: Nezhnayka28 (всего исправлений: 5)

Ответ на: комментарий от dvrts

да, по крайне мере для меня был, для заббикса есть дистрибы готовые, с кучей готовых шаблонов и тп, тупо свои ipшники пиши.

erzent ☆☆
()

Если указываю в команде:

# GPU + MEMORY  БЕЗ УКАЗАНИЯ ХОСТА
define command{
        command_name    check_ssh_nt
        command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C «/home/nagios/plugins/check_nt -v $ARG1$ $ARG2$»
}
то результат:
# GPU
UNKNOWN		 check_nt: You must provide a server address or host name 
# MEMORY
UNKNOWN		 check_nt: You must provide a server address or host name 

Если указываю в команде:

# GPU + MEMORY  C УКАЗАНИЕМ ХОСТА 127.0.0.1
define command{
        command_name    check_ssh_nt
        command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C «/home/nagios/plugins/check_nt -H 127.0.0.1 -v $ARG1$ $ARG2$»
}
то результат:
# GPU
CRITICAL	Connection refused 
# MEMORY
CRITICAL	Connection refused

Nezhnayka28
() автор топика
Ответ на: комментарий от erzent

поставь заббикс, нагиос для тебя слишком сложный.

Я хочу домучать по-минимуму nagios, а потом попробовать zabbix, чтобы было с чем сравнить.

Nezhnayka28
() автор топика
Ответ на: комментарий от Nezhnayka28

/home/nagios/plugins/check_nt -H 127.0.0.1 -v $ARG1$ $ARG2$



это вообще что и зачем? ты собираешься плагином для виндового сервиса проверить линуксовый локалхост?

vostrik ★★★☆
()

Результат:
CRITICAL SWAP CRITICAL - 100% free (0 MB out of 0 MB)
хотя в реали SWAP - 2%



ну запусти с -v, посмотри почему он у тебя не видит раздел

vostrik ★★★☆
()
Ответ на: комментарий от Nezhnayka28

https://www.monitoring-plugins.org/doc/man/check_nt.html

This plugin collects data from the NSClient service running on a
Windows NT/2000/XP/2003 server.

Usage:
check_nt -H host -v variable [-p port] [-w warning] [-c critical]
[-l params] [-d SHOWALL] [-u] [-t timeout]

check_ssh_nt - это вообще что такое?

vostrik ★★★☆
()
Последнее исправление: vostrik (всего исправлений: 1)
Ответ на: комментарий от vostrik

ну запусти с -v, посмотри почему он у тебя не видит раздел

/usr/lib64/nagios/plugins/check_by_ssh -H 185.52.167.144 -v -C «/home/nagios/plugins/check_swap -v -w 20 -c 10»

Результат:

Command: /usr/bin/ssh
Argument 1: 185.52.167.144
Argument 2: /home/nagios/plugins/check_swap -v -w 20 -c 10
SWAP CRITICAL - 100% free (0 MB out of 0 MB) |swap=0MB;0;0;0;0

check_ssh_nt - это вообще что такое?

Это я опеределил команду на основании вызова плагина check_nt:ъ

# GPU + MEMORY
define command{
        command_name    check_ssh_nt
        command_line    $USER1$/check_by_ssh -H $HOSTADDRESS$ -C «/home/nagios/plugins/check_nt -H $HOSTADDRESS$ -v $ARG1$ $ARG2$»
}
В первом посте она описана.

Nezhnayka28
() автор топика
Ответ на: комментарий от vostrik

This plugin collects data from the NSClient service running on a Windows NT/2000/XP/2003 server.

А все дошло, этот плагин только виндовые сервера на предмет: GPU, MEMORY мониторит. А каким плагином можно Linux-сервер на предмет: GPU, MEMORY мониторить?

Ну и SWAP все таки точно должен Linux-сервер мониторить.

Nezhnayka28
() автор топика

Иди на удаленный сервер как юзер nagios, запускай check_swap -w 20 -c 10 и смотри результат. Может у тебя там юзеры зажаты по-максимуму, даже своп посмотреть не могут.

anonymous
()
Ответ на: комментарий от Nezhnayka28

Результат:

Command: /usr/bin/ssh
Argument 1: 185.52.167.144
Argument 2: /home/nagios/plugins/check_swap -v -w 20 -c 10
SWAP CRITICAL - 100% free (0 MB out of 0 MB) |swap=0MB;0;0;0;0



а теперь cat /proc/swaps в студию

vostrik ★★★☆
()
Ответ на: комментарий от Nezhnayka28
 cat /usr/lib/nagios/plugins/check_cpu.sh 
#!/bin/sh

PATH=/bin:/usr/bin:/sbin:/usr/sbin
PROGNAME=`basename $0`
PROGPATH=`echo $0 | sed -e 's,[\\/][^\\/][^\\/]*$,,'`
REVISION=`echo 'Revision: 0.1'`
. $PROGPATH/utils.sh
STATE1=
STATE2=

print_usage() {
        echo "Usage: $PROGNAME -w <warning_threshold> -c <critical_threshold>"
}

print_revision() {
        echo $PROGNAME $REVISION
        echo ""
        echo "This plugin checks CPU load"
        echo ""
        exit 0
}


if [ $# -eq 1 ] && ([ "$1" == "-h" ] || [ "$1" == "--help" ]); then
        print_usage
        exit $STATE_UNKNOWN
elif [ $# -lt 4 ]; then
        print_usage
        exit $STATE_UNKNOWN
fi

while test -n "$1"; do
case "$1" in
        --help)
                print_usage
                exit 0
                ;;
        -h)
                print_usage
                exit 0
                ;;
        -V)
                print_revision $PROGNAME $REVISION
                exit 0
                ;;
        -w)
            WARNING=$2
            shift
            ;;
        -c)
            CRITICAL=$2
            shift
            ;;
        *)
            echo "Unknown argument: $1"
            print_usage
            exit $STATE_UNKNOWN
            ;;
esac
shift
done

if [ `uname` = 'Linux' ]; then
	CPU=`vmstat 2 3 | awk '{a=$15} END {print a}'`
	if [ -n "$CPU" ]; then
		CPU=$((100-$CPU))
		if [ $CPU -ge $CRITICAL ]; then
			echo "CRITICAL: CPU utilization is ${CPU}% | cpu=${CPU}%"
			exit $STATE_CRITICAL
		fi
		if [ $CPU -ge $WARNING ]; then
			echo "WARNING: CPU utilization is ${CPU}% | cpu=${CPU}%"
			exit $STATE_WARNING
		fi
		
		echo "OK: CPU utilization is ${CPU}% | cpu=${CPU}%"
		exit $STATE_OK
	else
		CPU='-1'
		echo "Unknown: CPU utilization is ${CPU}% | cpu=${CPU}%"
		exit $STATE_UNKNOWN
	fi
fi
anonymous
()
Ответ на: ты вообще гуглить не умеешь? от vostrik

а теперь cat /proc/swaps в студию

Filename                                Type            Size    Used    Priority
/dev/null                               partition       131072  9248    -1

Но вот вопрос, на этом сервере swap смотрирован, а вот на другом сервере хоть htop и показывает swap график, но при /proc/swaps ничего нет:

Filename                                Type            Size
почему?

ты вообще гуглить не умеешь?

https://www.google.com/search?q=nagios memory plugin https://www.google.com/search?q=nagios gpu plugin

да чего-то не смог сразу найти, спасибо.

anonymous

Спасибо

Nezhnayka28
() автор топика
Ответ на: комментарий от Nezhnayka28

Но вот вопрос, на этом сервере swap смотрирован, а вот на другом сервере хоть htop и показывает swap график, но при /proc/swaps ничего нет. почему?

Разобрался, htop всегда выводит график swap, даже если swap нет - думал что htop выводит swap график только если он есть в системе.

Nezhnayka28
() автор топика
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.