Si vous travaillez avec Google Cloud, cela vous concerne, car nous allons expliquer comment garder ce cloud sous contrôle avec une main de fer… dans un gant de velours. Aujourd’hui, nous examinons la supervision de Google Cloud, son importance et comment ce gant doux et blindé s’appelle Pandora FMS.
Nous connaissons tous le proverbe : le cloud n’existe pas, c’est simplement l’ordinateur de quelqu’un d’autre. Et pour les exigences opérationnelles actuelles, il est presque impossible pour une organisation de ne pas utiliser ces « ordinateurs des autres » et de fonctionner dans le cloud.
Fini les sous-sols surchauffés remplis de serveurs on-premise, moins efficaces en termes de puissance et de coûts.
Il est indéniable que, dans la Sainte Trinité actuelle des fournisseurs cloud (virtualisation, stockage, etc.), l’un des principaux acteurs est Google Cloud Platform (GCP).
C’est pourquoi nous analysons sa supervision aujourd’hui, car avoir la tête et les opérations dans le cloud, c’est bien, mais les pieds doivent rester sur terre et le contrôle dans nos mains, en collectant des métriques clés sur les performances, la disponibilité et la sécurité.
Ces données nous permettent de gérer les services cloud selon nos besoins réels, de détecter et anticiper les incidents, de savoir si nous gagnons vraiment en efficacité, en coûts et surtout en qualité de service, aussi bien pour les utilisateurs et les clients que pour notre productivité interne.

Éléments clés de la supervision des services Google Cloud

Google est l’entreprise qui disait “don’t be evil” avant de supprimer cette devise, donc mieux vaut garder un œil dessus et la comparer à d’autres options, potentiellement plus avantageuses.
Nous verrons comment Pandora FMS simplifie cette tâche, mais pour l’instant, l’idéal est de concentrer la surveillance de Google Cloud sur :

  • Machines virtuelles (Compute Engine) : Elles sont la base de nombreuses architectures. Il est essentiel de surveiller l’utilisation du CPU, de la mémoire, du disque et des E/S réseau pour garantir que les instances disposent des ressources nécessaires et fonctionnent correctement.
  • Conteneurs (Google Kubernetes Engine – GKE) : L’orchestration de conteneurs avec Kubernetes est omniprésente. La surveillance doit aller au-delà des nœuds pour inclure la santé des pods, les déploiements, les services et la consommation de ressources de chaque conteneur.
  • Applications (App Engine) : Le suivi des performances applicatives (APM) est crucial. Il faut suivre les indicateurs de niveau de service (SLI) et les objectifs (SLO) pour mesurer la latence, le trafic et le taux d’erreurs, en veillant à respecter les objectifs de performance.
  • Stockage et bases de données : Des services comme Cloud Storage, Cloud SQL ou BigQuery doivent être surveillés pour maîtriser la capacité, les performances des requêtes et les coûts associés.

Voilà les axes les plus classiques, mais Google Cloud propose plus de 100 services cloud. Il est donc impossible de tout détailler, d’autant que cette entreprise est célèbre pour lancer puis abandonner régulièrement de nombreux produits.
Il y en a tellement qu’il existe même un site web dédié aux produits qu’elle a supprimés.
Au moment d’écrire ces lignes, ils en sont à 298 — un défi supplémentaire pour toute stratégie de surveillance cloud.

Défis courants dans la surveillance des environnements cloud

Bien que Google Cloud fournisse des outils de surveillance puissants, les équipes IT font face à des défis majeurs lorsqu’elles doivent mettre en œuvre une stratégie de supervision.
Les principaux sont :

  • Variabilité des charges de travail : Les pics de demande et l’auto-scaling rendent la consommation de ressources imprévisible, ce qui complique la planification de la capacité.
  • Répartition géographique : Les applications distribuées à l’échelle mondiale introduisent de la latence et de la complexité dans la surveillance de l’expérience utilisateur depuis différentes régions.
  • Dépendances entre services : Une panne dans un microservice peut entraîner une cascade d’erreurs dans d’autres. Il est indispensable de disposer d’une visibilité permettant de retracer ces dépendances.
  • Visibilité globale : Obtenir une vue unifiée des performances et de la sécurité dans un écosystème de microservices distribués est un défi important.

À cela s’ajoute le fait que le cloud est aujourd’hui souvent hybride, que ce soit en coordonnant plusieurs fournisseurs en plus de Google, ou en intégrant également des ressources on-premise.
C’est pourquoi le plus important est une…

Surveillance unifiée dans des environnements hybrides

Un Anneau Unique, un Ordinateur Central de l’Enterprise, un seul Trône Doré de l’Empereur — tel est le Saint Graal d’une supervision centralisée, peu importe l’hétérogénéité de notre infrastructure.
Et c’est précisément pour cela que nous avons créé Pandora FMS.

Comment Pandora FMS surveille vos services Google Cloud

L’un des points forts de Pandora FMS est la surveillance de Google Cloud.
Pour cela, vous devez disposer de la version Pandora ONE, et la surveillance s’effectue via le plugin Google Compute Engine, accessible depuis Discovery > Cloud.

Selon la configuration initiale, il se peut que vous deviez d’abord installer le paquet .disco mentionné ci-dessus, via l’option Discovery > Gérer les paquets disco.
Bien entendu, tout est parfaitement documenté et, une fois la configuration initiale complétée, avec vos identifiants Google Cloud, les éléments à superviser et les métriques à collecter, vous pourrez surveiller :

  • Plusieurs environnements Google Cloud.
  • Des métriques prédéfinies et d’autres personnalisées selon vos besoins.
  • Générer des rapports et des graphiques de performance.
  • Recevoir des alertes personnalisées (par email, SMS, Telegram ou autres canaux) en cas de changements critiques…
  • Une supervision unifiée avec d’autres clouds comme Amazon ou Azure, si vous les utilisez également.

Peu importe les relations entre les géants technologiques ou leur compatibilité : Pandora FMS les aligne tous. Elle vous fournit des informations clés en un seul endroit, de manière homogène, quelle que soit leur origine, pour que vous sachiez exactement ce qui se passe.
Vous n’êtes pas obligés de nous croire sur parole — et vous auriez raison (même si mon éditrice pourrait bien supprimer cette phrase), c’est pourquoi nous vous invitons à le vérifier par vous-même en téléchargeant la version d’essai gratuite de Pandora ONE, ou en demandant une démo sans engagement, selon ce qui vous convient le mieux.
Ainsi, peu importe la volatilité de Google et ses services, Pandora FMS vous permet de les gérer de manière proactive, comme une horloge bien réglée, en parfaite harmonie avec le reste de votre infrastructure.

Shares