Ce mémo décrit la mise en place d’une supervision basée sur Centréon pour superviser un cluster Ceph haute disponibilité sous Proxmox.
Pour ce faire, j’ai configuré le plugin check-ceph-dash sur Centréon et installé ceph-dash sur chaque nœud qui compose mon cluster Ceph.
Mon choix s’est porté sur cette solution car ce couple de scripts m’apporte une grande souplesse pour la mise en service et me permet d’avoir un tableau de bord sur chacun de mes nœuds en plus de ma plateforme de supervision.
Installation de ceph-dash sur les nœuds du cluster Ceph
- Cloner le script sur chaque nœud :
cd opt/ git clone https://github.com/Crapworks/ceph-dash.git
cd ceph-dash/ ./ceph-dash.py
- Exemple de résultat :
OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828199913 read_op_per_sec=0 bytes_used=40517853184 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=0 write_bytes_sec=2040 bytes_avail=71831768145920
Créer un service pour exécuter ceph-dash automatiquement sur les nœuds avec systemd
- Se placer dans le répertoire des services :
cd /etc/systemd/system
nano ceph-dash.service
[Unit] Description=Monitoring Cluster Ceph [Service] Type=simple ExecStart=/opt/ceph-dash/ceph-dash.py -d Restart=on-failure [Install] WantedBy=multi-user.target
chmod +x ceph-dash.service
systemctl enable ceph-dash.service
systemctl start ceph-dash.service
systemctl status ceph-dash.service
● ceph-dash.service - Monitoring Cluster Ceph Loaded: loaded (/etc/systemd/system/ceph-dash.service; enabled) Active: active (running) since Wed 2017-03-29 13:21:27 CEST; 1min 9s ago Main PID: 147177 (python) CGroup: /system.slice/ceph-dash.service ├─147177 python /opt/ceph-dash/ceph-dash.py -d └─147182 /usr/bin/python /opt/ceph-dash/ceph-dash.py -d Mar 29 13:21:27 pve-02 systemd[1]: Started Monitoring Cluster Ceph. Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Running on http://0.0.0.0:5000/ Mar 29 13:21:27 pve-02 ceph-dash.py[147177]: * Restarting with reloader
Installation du plugin check_ceph_dash sur Centréon
- Se placer dans le répertoire des plugins :
cd /usr/lib/nagios/plugins
git clone https://github.com/Crapworks/check_ceph_dash.git
cd check_ceph_dash/ ./check-ceph-dash.py --url http://IP-cluster-01:5000
- Exemple de résultat :
OK: ceph cluster operates with no problems|bytes_total=71872285999104 num_pgs=1088 data_bytes=13828597225 read_op_per_sec=0 bytes_used=40509227008 num_osds=18 num_up_osds=18 num_in_osds=18 write_op_per_sec=0 read_bytes_sec=2040 write_bytes_sec=2040 bytes_avail=71831776772096