LINUX.ORG.RU
решено ФорумAdmin

Мониторинг raid hp smart array p212 без proliant support pack

 hp smart array p212,


0

3

Нужно отслеживать статус логического диска на raid-контроллере hp smart array p212(degraded или normal) или статус физических дисков и отправлять email в случае возникновения проблемы, но нет никакого желания ставить громоздкий hp proliant support pack. Можно ли обойтись без него? Используется Debian 6, но не думаю что это сильно принципиально.

# lspci -s 01:00.0 -vvv
01:00.0 RAID bus controller: Hewlett-Packard Company Smart Array G6 controllers (rev 01)
	Subsystem: Hewlett-Packard Company Smart Array P212
	Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV- VGASnoop- ParErr+ Stepping- SERR+ FastB2B- DisINTx+
	Status: Cap+ 66MHz- UDF- FastB2B- ParErr- DEVSEL=fast >TAbort- <TAbort- <MAbort- >SERR- <PERR- INTx-
	Latency: 0, Cache Line Size: 32 bytes
	Interrupt: pin A routed to IRQ 16
	Region 0: Memory at dca00000 (64-bit, non-prefetchable) [size=2M]
	Region 2: Memory at dc900000 (64-bit, non-prefetchable) [size=4K]
	Region 4: I/O ports at 2000 [size=256]
	[virtual] Expansion ROM at c0000000 [disabled] [size=512K]
	Capabilities: [40] Power Management version 3
		Flags: PMEClk- DSI- D1- D2- AuxCurrent=375mA PME(D0+,D1-,D2-,D3hot-,D3cold-)
		Status: D0 NoSoftRst+ PME-Enable- DSel=0 DScale=0 PME-
	Capabilities: [50] MSI: Enable- Count=1/1 Maskable- 64bit+
		Address: 0000000000000000  Data: 0000
	Capabilities: [70] Express (v2) Endpoint, MSI 00
		DevCap:	MaxPayload 256 bytes, PhantFunc 0, Latency L0s <1us, L1 <8us
			ExtTag- AttnBtn- AttnInd- PwrInd- RBE+ FLReset-
		DevCtl:	Report errors: Correctable+ Non-Fatal+ Fatal+ Unsupported-
			RlxdOrd+ ExtTag- PhantFunc- AuxPwr- NoSnoop+
			MaxPayload 128 bytes, MaxReadReq 512 bytes
		DevSta:	CorrErr+ UncorrErr- FatalErr- UnsuppReq+ AuxPwr- TransPend-
		LnkCap:	Port #0, Speed 5GT/s, Width x8, ASPM unknown, Latency L0 <512ns, L1 <64us
			ClockPM- Surprise- LLActRep- BwNot-
		LnkCtl:	ASPM Disabled; RCB 64 bytes Disabled- Retrain- CommClk+
			ExtSynch- ClockPM- AutWidDis- BWInt- AutBWInt-
		LnkSta:	Speed 5GT/s, Width x8, TrErr- Train- SlotClk+ DLActive- BWMgmt- ABWMgmt-
		DevCap2: Completion Timeout: Not Supported, TimeoutDis+
		DevCtl2: Completion Timeout: 50us to 50ms, TimeoutDis-
		LnkCtl2: Target Link Speed: 5GT/s, EnterCompliance- SpeedDis-, Selectable De-emphasis: -6dB
			 Transmit Margin: Normal Operating Range, EnterModifiedCompliance- ComplianceSOS-
			 Compliance De-emphasis: -6dB
		LnkSta2: Current De-emphasis Level: -6dB
	Capabilities: [ac] MSI-X: Enable+ Count=16 Masked-
		Vector table: BAR=0 offset=001c2000
		PBA: BAR=0 offset=001c4000
	Capabilities: [100 v1] Advanced Error Reporting
		UESta:	DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq- ACSViol-
		UEMsk:	DLP- SDES- TLP- FCP- CmpltTO- CmpltAbrt- UnxCmplt- RxOF- MalfTLP- ECRC- UnsupReq+ ACSViol-
		UESvrt:	DLP+ SDES+ TLP- FCP+ CmpltTO- CmpltAbrt- UnxCmplt- RxOF+ MalfTLP+ ECRC- UnsupReq- ACSViol-
		CESta:	RxErr- BadTLP- BadDLLP- Rollover- Timeout- NonFatalErr+
		CEMsk:	RxErr+ BadTLP+ BadDLLP+ Rollover+ Timeout+ NonFatalErr+
		AERCap:	First Error Pointer: 00, GenCap+ CGenEn- ChkCap+ ChkEn-
	Kernel driver in use: cciss

Там всего-то нужны пакеты:

hp-health
hp-snmp-agents
hpacucli
hponcfg
Если 10 Мб для тебя это громоздко, то даже не знаю...

bigbit ★★★★★
()

Я использую cpqarrayd. отсылает snmp trap (проверял выдергивая диск)

Monitoring list
 [ 0] Controller type 'CCISS Controller' at /dev/cciss/c0d0
 [ 1] Controller type 'CCISS Controller' at /dev/cciss/c1d0



04:03.0 RAID bus controller: Compaq Computer Corporation Smart Array 64xx (rev 01)
        Subsystem: Compaq Computer Corporation Smart Array 6i
        Control: I/O+ Mem+ BusMaster+ SpecCycle- MemWINV+ VGASnoop- ParErr+ Stepping- SERR+ FastB2B-
        Status: Cap+ 66Mhz+ UDF- FastB2B- ParErr- DEVSEL=medium >TAbort- <TAbort- <MAbort- >SERR- <PERR-
        Latency: 64, Cache Line Size 10
        Interrupt: pin A routed to IRQ 217
        Region 0: Memory at fddf0000 (64-bit, non-prefetchable) [size=8K]
        Region 2: I/O ports at 4000 [size=256]
        Region 3: Memory at fdd80000 (64-bit, non-prefetchable) [size=256K]
        Capabilities: [d0] Power Management version 2
                Flags: PMEClk- DSI- D1+ D2- AuxCurrent=0mA PME(D0-,D1-,D2-,D3hot-,D3cold-)
                Status: D0 PME-Enable- DSel=0 DScale=0 PME-
        Capabilities: [dc] PCI-X non-bridge device.
                Command: DPERE- ERO+ RBC=0 OST=4
                Status: Bus=4 Dev=3 Func=0 64bit+ 133MHz+ SCD- USC-, DC=simple, DMMRBC=2, DMOST=4, DMCRS=2, RSCEM-
        Capabilities: [f0] Vital Product Data


sdio ★★★★★
()
Ответ на: комментарий от bigbit

Дело в не 10Мб, да хоть 2Гб, меня это не сильно волнует. Громоздкость в том, что после установки proliant support pack открывается 100500 портов на listen, для которых нужно писать правила в фаерволе, мониторить наличие этих правил, изменять их при изменении внешних факторов, у меня нет ни времени ни желания всем этим заниматься, сервера чужие на моём обслуживании, мне нужно чтобы всё работало хорошо, обеспечить по максимуму безопасность при минимальных трудозатратах в процессе эксплуатации. Просто бизнес, а не красноглазие. Для красноглазия у меня есть тестовые серваки.

srg666
() автор топика
Ответ на: комментарий от sdio

Спасибо, а Вы случайно не в курсе почему этого пакета нет в debian 6(squeeze), при этом есть в lenny, wheezy и sid. Может он теперь по-другому называется или поглащён другим?

srg666
() автор топика
Ответ на: комментарий от srg666

Не поддерживается видимо. я его также со старого дебиана вытянул на РХЕЛ, течет память у него, не слишком, но раз в неделю я его перезапускаю по крону.

sdio ★★★★★
()
Ответ на: комментарий от srg666

Громоздкость в том, что после установки proliant support pack открывается 100500 портов на listen

Что, правда, что-ли?

# pgrep -l 'cma|hp' 
3867 hpasmlited
4336 hp-asrd
5943 cmahealthd
6000 cmastdeqd
6032 cmahostd
6059 cmathreshd
6105 cmasm2d
6161 cmasm2d
6200 cmaperfd
6238 cmapeerd
6291 cmaeventd
6322 cmafcad
6361 cmasasd
6423 cmaidad
6456 cmaided
6496 cmascsid
6529 cmanicd

# netstat -anp | egrep 'cma|hp'
udp        0      0 127.0.0.1:25393         0.0.0.0:*                           6529/cmanicd        
udp        0      0 127.0.0.1:25376         0.0.0.0:*                           6238/cmapeerd       
raw        0      0 0.0.0.0:255             0.0.0.0:*               7           6529/cmanicd        
raw        0      0 0.0.0.0:255             0.0.0.0:*               7           6529/cmanicd        
raw        0      0 0.0.0.0:255             0.0.0.0:*               7           6529/cmanicd        
unix  2      [ ]         DGRAM 

У меня слушаются всего 2 порта на 127.0.0.1, плюс cmanicd использует raw-сокеты. Агенты можно выборочно отключить (тот же cmanidcd), если паранойя.

bigbit ★★★★★
()
Ответ на: комментарий от sdio

ему hpacucli хватит. По крону cli запускать и смотреть статус по крону. Если память не изменяет, то smartctl умеет с smart array работать, можно напрямую смотреть состояние дисков.

xpahos ★★★★★
()

поставь hpacucli и из крона вызывай show status - этого достаточно.

zloelamo ★★★★
()
22 июня 2012 г.

скрипт проверки состояния дисков
/usr/sbin/hpacucli ctrl all show status | grep -q 'Not OK' && /usr/sbin/hpacucli ctrl all show status
for slot in `/usr/sbin/hpacucli ctrl all show status|egrep -o 'in Slot [0-9]+'|egrep -o '[0-9]+'`
do
/usr/sbin/hpacucli ctrl slot=$slot pd all show 2>&1 | grep physicaldrive|grep -v 'OK)'
done

добавляем в крон
crontab -e
@daily /usr/local/sbin/hparray-check

Marvin
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.