A la fin du siècle dernier j’ai eu l’opportunité d’aider dans un projet informatique très ambitieux : la recherche de messages radio émis par des civilisations extraterrestres… Et qu’est-ce que ça a à voir avec les Systèmes distribués ?

Récemment, mes collègues ont écrit un article intéressant sur la visibilité du réseau distribué, que j’ai vraiment aimé et j’ai pensé l’amener à un niveau supérieur. Si ce poste tente d’avoir une connaissance complète des différents composants en fonctionnement au sein de notre réseau, les Systèmes distribués vont « plus loin » ; ils atteignent là où nous manquons de contrôle sur les appareils qui les composent.

Je vais illustrer les deux au niveau des sciences sociales, en comparant un syndicat à une confédération (dans son deuxième sens en français, en tant que centrale de travailleurs et de syndicats et non d’un point de vue politique).

*Confédération

Selon le dictionnaire Larousse.

2. Groupement de diverses associations de caractère sportif, professionnel, etc.

Informatique distribuée, systèmes distribués, sont-ils pareils ?

Systèmes distribués

Si vous recherchez le concept de Systèmes Distribués sur Wikipedia (ce lieu magique) vous serez redirigé vers l’article intitulé Calcul distribué.

Le calcul distribué est un modèle de résolution de problèmes informatiques massifs utilisant un grand nombre d’ordinateurs organisés en clusters intégrés dans une infrastructure de télécommunications distribuée.

Sans aller plus loin : Wikipédia, si nous nous considérons comme des ordinateurs, est un Système Distribué de très haut niveau, puisque nous respectons ses caractéristiques intrinsèques… Et quelles sont-elles ?

Caractéristiques des systèmes distribués

Un système distribué (ou Calcul distribué) a :

•   Concurrence : qui dans le cas des ordinateurs est un programme distribué et dans Wikipédia ce sont des gens… qui utilisent des logiciels spécialisés distribués par des navigateurs web.

•   Asynchrone : chaque ordinateur (ou wikipédien) fonctionne indépendamment sans attendre un résultat de l’autre, lorsqu’il termine son lot de travail, il le livre et il est assimilé et sauvegardé.

•   Résilience : un appareil informatique qui tombe en panne ou perd la connexion, ou une personne qui meurt, se retire ou est expulsée de Wikipédia, dans les deux environnements il ne signifie pas arrêter le travail ou la tâche globale. Il y aura toujours de nouvelles ressources, machines ou humains, prêtes à rejoindre le Système Distribué.

Les extraterrestres

Bon, j’ai commencé cet article en parlant d’eux. Dans le radiotélescope aujourd’hui – malheureusement – détruit à Arecibo, Porto Rico, les astronomes Carl Sagan et Frank Drake ont envoyé un message à l’amas d’Hercule, un groupe de galaxies à 25 000 années-lumière de notre planète.

“Hercules Globular Cluster (https://commons.wikimedia.org/wiki/File:Hercules_Globular_Cluster,_EVscope-20211008.jpg) ”

Cela signifie qu’il faudra 50 000 ans pour obtenir une réponse, s’il y a de la vie là-bas, mais que se passe-t-il si c’est nous qui avons déjà reçu des messages il y a des milliers ou des millions d’années ?

Eh bien, c’était le but du programme Seti@home : il collectait des signaux radio et les découpait en morceaux de deux minutes qu’il envoyait à chaque personne qui voulait collaborer à l’analyse avec son ordinateur. A la fin du calcul selon un algorithme spécial, le résultat était envoyé et un nouveau morceau de code était demandé. Si un ordinateur après un délai raisonnable ne retournait pas de réponse, alors la même pièce était envoyée à un autre ordinateur qui souhaitait collaborer : le “prix” consistait à reconnaître publiquement la personne collaborant comme découvreur de la vie et de l’intelligence hors de ce monde.

J’ai installé ce programme et l’ai mis comme programme de protection d’écran, donc je le calculais pendant que je travaillais sur autre chose ou que je me reposais.

“Seti@home (imagen de setiathome.berkeley.edu) ”

Et voilà ! Un système distribué pour analyser les signaux radio de l’univers !

Supervision distribuée

La supervision distribuée dépend de la topologie de réseau utilisée, et je l’aborde comme une introduction ou une approche de la supervision d’un système distribué.

Il s’agit essentiellement d’environnements distribués qui servent une entreprise ou une organisation mais n’exécutent pas de logiciels communs et ont des domaines ou des objectifs très différents entre les départements, soutenus par une communication avec une topologie réseau distribué accompagnée d’une supervision de l’architecture bien planifiée de sécurité dans la supervision.

Pandora FMS propose un service de supervision dans ce domaine, très bien décrit dans la documentation officielle.

Observabilité

Ce serait un attribut d’un système, et le sujet suffit pour une entrée de blog complète, mais en bref, j’expose l’observabilité comme un concept global qui inclut les activités de supervision plus les alertes et la gestion des alertes, la visualisation et analyse des traces pour les systèmes distribués et analyse des journaux.

Chez Twitter ont pris l’observabilité très au sérieux, et comme vous l’avez peut-être deviné, ce réseau social hautement addictif est un système distribué mais avec un produit final flou (augmentant nos connaissances sur le monde réel) .

Supervision transactionnelle

Comment surveiller un système distribué s’il est constitué de composants très hétérogènes et, comme nous l’avons vu, peut atteindre n’importe quelle partie de notre univers connu ?

Pandora FMS dispose de la Supervision transactionnelle d’affaires, un outil que je considère comme le plus approprié pour les systèmes distribués puisque nous pouvons configurer des transactions, autant que nous en avons besoin, puis utiliser les agents transactionnels nécessaires pour cela.

C’est un sujet difficile à digérer, mais notre documentation commence par un exemple, simple et pratique, avec lequel, au fur et à mesure que vous expérimentez, vous pouvez ajouter des « blocs » de transaction plus complexes jusqu’à ce que vous atteignez un point où vous pouvez avoir une vue d’ensemble du système distribué.

Tout cela est possible avec Pandora FMS car il dispose d’une supervision standard, de contrôles à distance, supervision synthétique transactionnelle et le serveur satellite pour environnements distribués qui peuvent être utilisés avec la supervision transactionnelle pour systèmes distribués.

Présent et futur

La question n’est plus de savoir si nous avons besoin de systèmes distribués. Ceci est un fait avéré. Le monde d’aujourd’hui utilise des systèmes distribués dans les services informatiques dans le cloud ou dans les centres de données et sur Internet.

Les systèmes distribués peuvent offrir des fonctionnalités impossibles dans les systèmes monolithiques ou tirer parti des processus informatiques, tels que la restauration à partir de sauvegardes en demandant à d’autres systèmes des morceaux manquants ou corrompus sur le système local.

Shares