Intégration de Prometheus &#x26; Grafana pour monitorer mon cluster Kubernetes auto-hébergé, avec accès HTTPS public, dashboard par défaut personnalisé et sécurité maintenue, le tout dans une logique MVP GitOps.
Dans cette sixième étape, j'intègre un système de monitoring pour superviser mon cluster Kubernetes, toujours dans une logique MVP, auto-hébergée, et sans complexité inutile.
<hr>
<h3>Objectif : visibilité simple et efficace</h3>
Je veux pouvoir visualiser l'état de mon cluster en un coup d’œil : CPU, mémoire, pods, réseau. Pas de sur-ingénierie, pas d’alerts emails, juste un dashboard clair.
J'utilise le chart Helm <a href="https://github.com/prometheus-community/helm-charts/tree/main/charts/kube-prometheus-stack">kube-prometheus-stack</a>, largement adopté en prod, même s’il est ici sous-utilisé dans un but pédagogique.
<hr>
<h3>Installation via Helm</h3>
<pre><code>helm repo add prometheus-community https://prometheus-community.github.io/helm-charts
helm repo update

helm upgrade --install monitoring prometheus-community/kube-prometheus-stack \
 --namespace monitoring \
 --create-namespace \
 --values prometheus-stack-values.yaml
</code></pre>
J'ai désactivé <code>alertmanager</code> dans le <code>values.yaml</code>, car je ne souhaite pas gérer d'alertes pour ce MVP :
<pre><code class="hljs language-yaml">alertmanager:
 enabled: false
</code></pre>
<hr>
<h3>Pourquoi ne pas utiliser le module Prometheus de MicroK8s ?</h3>
MicroK8s propose un module <code>prometheus</code> activable en une ligne :
<pre><code>microk8s enable prometheus
</code></pre>
Mais ce module reste une boîte noire difficile à intégrer dans un workflow GitOps :
<ul>
<li>Il n'est pas versionné dans le dépôt Git</li>
<li>Il n'offre quasiment aucun contrôle sur la configuration ou les versions</li>
<li>Il ne permet pas de séparer proprement Grafana et Prometheus</li>
</ul>
En choisissant le chart Helm <code>kube-prometheus-stack</code>, je garde la maîtrise complète de la configuration via mon <code>values.yaml</code>, je peux versionner mon infrastructure, et je rends mon setup portatif sur n'importe quel autre cluster Kubernetes cloud ou local.
<hr>
<h3>Accès à Grafana</h3>
J'ai créé un Ingress à <code>grafana.woulf.fr</code> avec certificat HTTPS géré par <code>cert-manager</code>.
L'accès admin est protégé par un <code>Secret</code> Kubernetes (non committé) défini comme :
<pre><code class="hljs language-yaml">grafana:
 admin:
 existingSecret: monitoring-grafana
</code></pre>
<blockquote>
Création du Secret
<pre><code>kubectl -n monitoring create secret generic monitoring-grafana \
 --from-literal=admin-user=admin \
 --from-literal=admin-password=********
</code></pre>
</blockquote>
Et pour permettre un accès public simple, j’ai activé l'accès anonyme avec le rôle <code>Viewer</code> (lecture seule) :
<pre><code class="hljs language-yaml">grafana:
 grafana.ini:
 auth.anonymous:
 enabled: true
 org_name: Main Org.
 org_role: Viewer
 hide_version: true
</code></pre>
<hr>
<h3>Dashboard par défaut</h3>
J'ai choisi le dashboard <code>Kubernetes / Compute Resources / Cluster</code> fourni par défaut dans le chart, puis je l’ai exporté, versionné dans un <code>ConfigMap</code>, et monté comme dashboard d’accueil :
<pre><code class="hljs language-yaml">grafana:
 grafana.ini:
 dashboards:
 default_home_dashboard_path: /var/lib/grafana/dashboards/grafana-dashboard-home/default.json
 dashboardsConfigMaps:
 grafana-dashboard-home: grafana-dashboard-home
 sidecar:
 dashboards:
 enabled: true
 label: grafana_dashboard
 searchNamespace: ALL
</code></pre>
Le <code>ConfigMap</code> correspondant est versionné dans le repo d’infra, et porte le label <code>grafana_dashboard: "1"</code> pour être pris en compte automatiquement par le sidecar Grafana.
<blockquote>
📁 Un <code>ConfigMap</code> est une ressource Kubernetes qui permet de monter des fichiers non sensibles dans un pod.
Il est rechargé automatiquement en cas de modification.
</blockquote>
<hr>
<h3>Résultat</h3>
<ul>
<li>Grafana accessible publiquement, en HTTPS</li>
<li>Dashboard par défaut lisible et utile</li>
<li>Aucun login requis pour consulter l’état du cluster</li>
<li>Compte admin sécurisé via Secret Kubernetes</li>
</ul>
Cette approche respecte les bonnes pratiques DevOps, tout en restant simple et facilement compréhensible pour un visiteur ou un recruteur.
<hr>
<h2>🧠 Et en production ?</h2>
Ce setup est volontairement minimaliste et pédagogique, mais plusieurs aspects seraient renforcés dans un contexte de production :
<ul>
<li>Alertmanager serait activé, avec des routes d’alerte vers des services externes (email, Slack, etc.), pour être notifié dès qu’un composant tombe.</li>
<li>L’accès Grafana ne serait pas ouvert en anonyme : il serait restreint par IP, protégé par un proxy ou connecté à un SSO/LDAP.</li>
<li>Le mot de passe admin ne serait pas géré via un <code>Secret</code> statique, mais externalisé via Vault ou une solution de gestion de secrets (SealedSecrets, ExternalSecrets).</li>
<li>Les dashboards seraient provisionnés via API ou fichiers dédiés, avec une stratégie de gestion de version plus modulaire.</li>
<li>Le certificat TLS serait géré via des mécanismes de rotation automatique à plus grande échelle (wildcard DNS, ACME DNS challenge...).</li>
</ul>
Mais dans le cadre de ce MVP, cette configuration me donne un bon équilibre entre simplicité, lisibilité, sécurité de base et maintenabilité GitOps.
<hr>
⚡ Prochaine étape : ajout de <code>loki</code> pour la collecte de logs centralisée ? Ou test d’ArgoCD pour GitOps avancé ?
C'est ouvert !