Cas client Rakuten

Améliorez votre infrastructure et
le contrôle de vos systèmes grâce à Pandora FMS

Rakuten, qui développe la plus large gamme de services Internet au Japon, a créé avec Pandora FMS une infrastructure de surveillance très fiable et peu coûteuse. Les services Internet proposés par Rakuten Inc. doivent être accessibles à tous, en permanence et de n’importe où. Pour exploiter de manière optimale et à faible coût un service Internet de grande envergure comptant plus de 73,6 millions d’utilisateurs, Rakuten a choisi Pandora FMS Enterprise et a mis en place un cadre de surveillance intégré qui répond de manière flexible aux futures expansions du service.

MCM SVG

POINT DE DÉPART

Rakuten Inc. (ci-après dénommée “Rakuten”) a pour objectif d’être “la première société de services Internet” et développe un large éventail d’activités : “Rakuten Ichiba”, la plus grande boutique en ligne du Japon, “Rakuten Travel”, une société de voyages, “Infoseek”, un portail médiatique, “Rakuten Securities” et “Rakuten Card”, qui gère les opérations financières et les plans de vente de l’équipe de baseball professionnelle “Tohoku Rakuten Golden Eagles”. L’entreprise a créé le “bloc économique Rakuten” où plus de 73 millions d’utilisateurs (en septembre 2011) bénéficient de divers services Internet.

Rworks Inc, partenaire certifié de Pandora FMS, a présenté Pandora FMS Enterprise à Rakuten Inc. comme la solution pour surveiller l’ensemble de l’infrastructure des services Internet et a obtenu un outil de surveillance à faible coût, nécessaire à l’opération.

Il faut dire que les services offerts par Rakuten doivent être de haut niveau. Si l’on prend l’exemple de Rakuten Ichiba, il propose un service à grande échelle auquel participent 37 000 boutiques qui enregistrent plus de 88 millions d’articles (en décembre 2011).

“Pour fournir des services de haut niveau aux clients, nous exploitons la majeure partie de l’infrastructure partagée composée de centaines de serveurs. L’infrastructure partagée garantit la flexibilité, la robustesse et la performance optimale, de sorte que le service est toujours opérationnel. Ainsi, les clients peuvent utiliser nos services comme ils le souhaitent.”

Yoshinori Nemoto, Chef du groupe des opérations et du développement de l’infrastructure partagée

DÉFI DU PROJET

Rakuten a mis en place un puissant cadre de contrôle intégré en mai 2001. Depuis lors, Rakuten a maintenu des opérations optimales.

Le cadre de surveillance intégré couvre quelques services de Rakuten, assure la surveillance des services et des éléments aux opérateurs en fonction de leurs responsabilités et établit des flux de travail pour les situations imprévues. En cas de panne d’un service, il est possible de réagir de manière appropriée et rapide.

L’opération principale du système de surveillance est la surveillance en temps réel, mais le nombre de cibles et d’éléments à surveiller augmente chaque fois qu’un service est ajouté. Ils ont augmenté de 20 à 30 % au cours des dernières années et il y a maintenant plus de 10 000 agents et éléments. Cependant, l’augmentation des services n’est pas près de s’arrêter.

antenas

En outre, compte tenu des tendances à la virtualisation et du passage à des systèmes en nuage dans l’infrastructure commune, le nombre d’objectifs et de postes devrait augmenter plus que jamais. L’augmentation des coûts devient un défi majeur pour l’entreprise.

Le nouveau système devait répondre à l’expansion de l’entreprise à moindre coût. C’est pourquoi la rénovation du système de surveillance vieux de 10 ans a été envisagée.

POURQUOI PANDORA FMS ?

Le facteur décisif dans le choix de Pandora est qu’il s’agit d’un produit supérieur à tous points de vue.

Les cinq points suivants ont été au centre de l’évaluation des nouveaux systèmes :

check   Coût d’introduction et d’exploitation.
check   Simplicité de la migration des données.
check   Faisabilité d’une configuration à haute disponibilité.
check   Continuité du processus opérationnel dans l’environnement existant, y compris la surveillance des éléments existants.
check   Mise en œuvre de nouveaux éléments de surveillance à l’avenir.

Outre la réduction des coûts, la configuration de haute disponibilité était une exigence pour l’outil de surveillance. La facilité de migration vers le nouvel environnement était également indispensable pour alléger la charge des opérateurs.

“Nous avons évalué à la fois des produits open source et des produits commerciaux. Nous avons conclu que le TCO (Total Cost of Ownership) incluant la licence Pandora FMS était le meilleur. En fait, nous pouvons contrôler l’amélioration de nos systèmes grâce à l’augmentation des éléments contrôlés et le coût a été réduit de 40 % par rapport au système actuel.”

Yoshinori Nemoto, Chef du groupe des opérations et du développement de l’infrastructure partagée

La saisie manuelle de plus de 10 000 éléments de surveillance n’est pas pratique. Comme Pandora offre une API et des plugins, la migration et l’insertion des éléments sont faciles.

Le projet a démarré en août 2011. Quatre mois plus tard, en décembre, le fonctionnement du nouveau système a été transféré dans l’environnement de production. Au cours du premier trimestre 2012, nous avons effectué le passage complet au nouveau système.

Outre le serveur de surveillance dans le centre de données, la configuration du nouveau cadre de surveillance intégré pour lequel Pandora FMS a été choisi.

Elle est divisée en trois groupes :

check  Surveillance SYSLOG/SNMP avec configuration HA.
check  Surveillance des services IPv4 avec 5+1 redudance.
check  Surveillance des services IPv6 avec redondance 1+1.

antenas

Comme la configuration a également été déployée dans un autre centre de données, le système dispose d’une redondance sur deux centres de données. De plus, cette configuration peut être facilement étendue en ajoutant un autre serveur.

Comme Pandora offre une API et des plugins, la migration et l’insertion des éléments sont faciles. Après avoir validé la haute disponibilité du système de surveillance, nous avons constaté que les produits Open Source ne permettaient pas d’obtenir une configuration de haute disponibilité et que les produits commerciaux nécessitaient des versions de cluster supplémentaires coûteuses, ce qui se traduisait par des systèmes plus onéreux que le système existant.

En revanche, avec Pandora FMS, il est facile de créer un système à haute disponibilité de meilleure qualité que les produits commerciaux.

“Du point de vue de ceux qui utilisent le service de surveillance en interne, le plus grand mérite est que le produit peut être déployé avec la même configuration que le système existant sans changer le processus opérationnel. J’apprécie vraiment le produit car il a permis une migration transparente malgré les nombreux processus opérationnels existants et a offert de nombreuses fonctionnalités.”

Kazuhito Fujimaki, Chef de groupe

“Nous avons développé un programme pour convertir les données nous-mêmes en utilisant l’API de Pandora. En exportant les données existantes et en saisissant l’ensemble des valeurs nécessaires, nous avons migré plusieurs dizaines de milliers d’éléments contrôlés en une journée. La grande flexibilité de Pandora FMS nous a permis de migrer le système en douceur. Bien que Pandora soit un logiciel commercial basé sur l’Open Source, il fournit un niveau de service élevé et assure une surveillance redondante du système. Il s’agit d’un produit innovant. Pour Rakuten, la redondance et la flexibilité sont très importantes et le produit nous convient parfaitement.”

Shigema Takeda, membre du groupe de développement et d’exploitation de l’infrastructure partagée

AVANTAGES DE PANDORA FMS

“Grâce à Pandora, il est possible d’intégrer des fonctions non planifiées ou des développements personnalisés dans le système de surveillance intégré. Dans les prochaines étapes, en plus de la surveillance en temps réel actuelle, nous voulons utiliser davantage de fonctionnalités de surveillance de l’expérience utilisateur, telles que le temps de chargement d’un site web et la surveillance du contenu.”

Kazuhito Fujimaki, directeur du groupe

Rakuten fait entièrement confiance à Rworks et à sa rapidité de réaction, qui a corrigé les bogues en moins de deux jours et fourni un retour d’information sur l’ajout de nouvelles fonctionnalités en moins d’une semaine. Grâce à la création des procédures de base de Rworks, Rakuten a pu réduire le nombre d’heures de travail.

Afin d’atteindre l’objectif de Rakuten d’être “la première société de services Internet”, la création d’un système de suivi flexible est indispensable. La distribution de Pandora FMS Enterprise par Rworks joue un rôle important à cet égard.

“Nous apprécions vraiment la rapidité de réaction de Rworks. Le déploiement à grande échelle commence maintenant et nous attendons beaucoup du soutien de Rworks. En particulier, nous voulons que Rworks nous aide dans tout ce que nous ne pouvons pas faire nous-mêmes.”

Yoshinori Nemoto, Chef du groupe des opérations et du développement de l’infrastructure partagée

Des doutes, des suggestions ou des commentaires ?

Notre proposition vous paraît-elle attrayante ?