Monitoring von Hosts und Services mit icinga

nrpe-Checks

Was noch fehlt: Unterstützung von x509-Zertifikaten, ich mache hier alles unverschlüsselt und unsigniert über ein VPN.

Installation auf Monitoring-Host

Debian wheezy:

apt-get install nagios-nrpe-plugin

Installation auf Remote-Host

Ubuntu:

apt-get install nagios-nrpe-server

Datei /etc/nagios/nrpe.cfg anpassen:

server_address=$VPN_IP_ADDRESS
allowed_hosts=$ICINGA_HOST

VPN_IP_ADDRESS ist hierbei eine lokale IP-Adresse, gibt man die nicht an, bindet sich der nrpe-Server an alle Adressen, man müsste dann wahrscheinlich die Firewall entsprechend anpassen, dass Zugriffe darauf nur erlaubten Host gestattet werden. ICINGA_HOST sind die Maschinen, auf denen die Überwachungen laufen, eine Komma-getrennte Liste von IP-Adressen, Hostnamen oder Netzen.

Mögliche Probleme

NRPE-Check gibt falsche Auskunft

Ich habe auf mehreren Hosts einen NRPE-Check nach der Anzahl Apache-Prozesse eingerichtet (es müssen einer oder mehr Apache-Prozesse laufen):

command[check_daemon_apache]=/usr/lib/nagios/plugins/check_procs -C apache2 -c 1:

Das hat bei zwei Hosts funktioniert, bei einem nicht, der lokale Check war schon nicht zufrieden:

$ /usr/lib/nagios/plugins/check_procs -C apache2 -c 1:
PROCS CRITICAL: 0 processes with command name 'apache2'

Gefunden habe ich dann das, nachdem ich den Check etwas geschwätziger gemacht hatte:

$ /usr/lib/nagios/plugins/check_procs -C apache2 -c 1: -vvvvv
...
Ss       0 22809     1 360668 17420  0.0       17:26 /usr/sbin/apach /usr/sbin/apache2 -k startproc#=0 uid=0 vsz=360668 rss=17420 pid=22809 ppid=1 pcpu=0.00 stat=Ss etime=17:26 prog=apach args=/usr/sbin/apache2 -k start
Ss       0 22812     1  14992  2460  0.0       17:26 htcacheclean    /usr/sbin/htcacheclean -n -d120 -i -p/var/cache/apache2/mod_disk_cache -l300Mproc#=0 uid=0 vsz=14992 rss=2460 pid=22812 ppid=1 pcpu=0.00 stat=Ss etime=17:26 prog=htcacheclean args=/usr/sbin/htcacheclean -n -d120 -i -p/var/cache/apache2/mod_disk_cache -l300M
S       33 22814 22809 574668 119592 0.6       17:26 /usr/sbin/apach /usr/sbin/apache2 -k startproc#=0 uid=33 vsz=574668 rss=119592 pid=22814 ppid=22809 pcpu=0.60 stat=S etime=17:26 prog=apach args=/usr/sbin/apache2 -k start
S       33 22815 22809 598836 144064 0.6       17:26 /usr/sbin/apach /usr/sbin/apache2 -k startproc#=0 uid=33 vsz=598836 rss=144064 pid=22815 ppid=22809 pcpu=0.60 stat=S etime=17:26 prog=apach args=/usr/sbin/apache2 -k start
S       33 22994 22809 597800 142532 0.6       14:35 /usr/sbin/apach /usr/sbin/apache2 -k startproc#=0 uid=33 vsz=597800 rss=142532 pid=22994 ppid=22809 pcpu=0.60 stat=S etime=14:35 prog=apach args=/usr/sbin/apache2 -k start

Wie man fast ganz hinten sieht, findet der Checker nur "prog=apach". Schreibt man den Check um, funktioniert er:

$ /usr/lib/nagios/plugins/check_procs -C apach -c 1: 
PROCS OK: 4 processes with command name 'apach'
Meine Tags:
 
Beliebte Tags:
 
Powered by Catalyst