お客様事例 Rakuten

インフラとシステム管理の改善 Pandora FMS

日本で最も広範なインターネットサービスを展開する楽天株式会社は、Pandora FMS により、高信頼かつ低コストな監視インフラを構築しました。楽天株式会社が提供するインターネットサービスは、誰もが、いつでも、どこからでも利用できるものでなければなりません。7,360 万人以上のユーザを持つ大規模なインターネットサービスを低コストで最適に運用するために、楽天は Pandora FMS Enterprise を選択し、将来のサービス拡張に柔軟に対応できる統合監視フレームワークを構築しました。

MCM SVG

スターティングポイント

楽天株式会社(以下、「楽天」という。(楽天株式会社(以下、楽天)は、「インターネットサービスNo.1企業」を目指し、日本最大のEC・オンラインショップ「楽天市場」、旅行事業「楽天トラベル」、メディア事業ポータル「Infoseek」、「楽天証券」、プロ野球球団「東北楽天ゴールデンイーグルス」の財務運営や物販企画を行う「楽天カード」など、幅広い事業を展開している。7,300万人以上(2011年9月現在)のユーザーが様々なインターネットサービスを利用する「楽天経済圏」を構築している。

Pandora FMS 認定パートナーである株式会社アールワークスは、インターネットサービスのインフラ全体を監視するソリューションとして Pandora FMS Enterprise を楽天株式会社に提案し、運用に必要な監視ツールを低コストで実現しました。

楽天が提供するサービスは、高水準でなければならないと言わざるを得ない。楽天市場を例にとると、37,000店舗が参加し、8,800万点以上(2011年12月現在)の商品を登録する大規模なサービスを提供している。

“顧客にトップレベルのサービスを提供するため、数百台のサーバーで構成される共有インフラの大部分を運用しています。共有インフラにより、柔軟性、堅牢性、最適なパフォーマンスが保証され、サービスは常に稼働しています。その結果、お客様は当社のサービスを自由に利用することができます。”

共有インフラ運用・開発グループ長 根本義則

プロジェクト・チャレンジ

楽天は2001年5月、強力な統合監視フレームワークを構築した。以来、楽天は最適なオペレーションを維持している。

統合監視フレームワークは、楽天のいくつかのサービスをカバーし、サービスや要素の監視をオペレータの責任に応じて提供し、不測の事態に備えたワークフローを確立している。万が一サービスがダウンした場合でも、適切かつ迅速な対応が可能だ。

監視システムの主な運用はリアルタイム監視だが、監視対象や監視要素はサービスが追加されるたびに増えていく。ここ数年で20〜30%増加し、現在では1万を超えるエージェントや項目が存在する。しかし、サービスの増加はとどまるところを知らない。

antenas

また、共通インフラにおける仮想化動向やクラウドシステムへの移行に伴い、ターゲットやアイテム数はこれまで以上に増加することが予想される。コスト増が大きな課題となる。

E新システムは、低コストで事業拡大に対応する必要があった。そこで検討されたのが、10年前の監視システムの刷新だった。

なぜPANDORA FMSなのか?

パンドラを選んだ決め手は、あらゆる面で優れた製品であること。

新システムの評価の焦点となったのは、以下の5点である:

check 導入と運用のコスト。
check データ移行の簡便性。
check 高可用性構成の可能性。
check 既存項目の監視を含めた既存環境での運用プロセスの継続性。
check 将来の新たな監視項目の導入。

コスト削減に加え、高可用性構成が監視ツールの要件であったこと。また、運用者の負担を軽減するため、新環境への移行の容易さも必須条件だった。

“オープンソースと商用製品の両方を評価しました。その結果、Pandora FMS ライセンスを含む TCO (Total Cost of Ownership) が最も優れているという結論に達しました。実際、監視項目が増えたことでシステムの改善をコントロールすることができ、コストも現在より40%削減できました。”

共有インフラ運用・開発グループ長 根本義則氏

10,000以上の監視項目を手作業で入力するのは現実的ではありません。Pandora は API とプラグインを提供しているので、項目の移行と挿入は簡単です。

プロジェクトは2011年8月にスタートした。4ヵ月後の12月、新システムの運用が本番環境に移された。2012年第1四半期には、新システムへの完全な切り替えを行った。

データセンターのモニタリングサーバに加えて、Pandora FMS が選択された新しい統合モニタリングフレームワークの構成です。

それは、以下の 3つのグループに分かれています:

check HA 構成による SYSLOG/SNMP モニタリング。
check 5+1 リダンダンスによる IPv4 サービスの監視。
check そして、1+1 冗長構成による IPv6 サービスの監視です。

antenas

この構成は別のデータセンターにも導入されているため、システムは2つのデータセンターで冗長性を持っています。さらに、この構成は、別のサーバを追加することで簡単に拡張できます。

Pandora は API とプラグインを提供しているため、アイテムの移行や挿入は簡単です。モニタリングシステムの高可用性を検証した結果、オープンソースの製品では高可用性を実現できず、商用製品では高価なクラスタバージョンを追加する必要があり、結果として既存のシステムよりも高価になることがわかりました。

一方、Pandora FMS を使えば、商用製品よりも高品質な高可用性システムを簡単に構築できます。

“社内で監視サービスを利用する立場からすると、運用プロセスを変えずに既存システムと同じ構成で導入できることが最大のメリットです。既存の運用プロセスが多い中でもシームレスな移行を可能にし、多くの機能性を提供してくれた製品には本当に感謝しています。”

グループ長 藤巻和仁氏

“私たちは、Pandora API を使ってデータを変換するプログラムを開発しました。既存のデータをエクスポートし、必要な値を入力することで、1日で数万件のモニタリング項目を移行しました。Pandora FMS の優れた柔軟性により、スムーズにシステムを移行することができました。Pandora は、オープンソースをベースにした商用ソフトウェアですが、高いレベルのサービスを提供し、システムの冗長監視を保証します。革新的な製品です。楽天にとって、冗長性と柔軟性は非常に重要であり、この製品は非常に適しています。”

シェアードインフラ運用開発グループ 武田茂馬氏

のメリットPANDORA FMS

“Pandora を使うことで、予定外の機能やカスタム開発を統合監視システムに統合することができます。次のステップでは、現在のリアルタイムモニタリングに加えて、ウェブサイトの読み込み時間やコンテンツモニタリングなど、より多くのユーザーエクスペリエンスモニタリング機能を利用したいと考えています。”

グループ・ヘッド・マネージャー 藤巻和仁氏

楽天は、2日以内にバグを修正し、1週間以内に新機能の追加をフィードバックするRworksの迅速な対応に全幅の信頼を寄せている。Rworksの基幹手順書を作成したおかげで、楽天は工数を削減することができた。
楽天が目指す「インターネットサービスNo.1」の実現には、柔軟な監視体制の構築が欠かせない。Rworksが提供するPandora FMS Enterpriseは、その重要な一翼を担っている。

“Rworksの対応の早さには本当に感謝しています。これから大規模な展開が始まりますが、Rworksのサポートに期待しています。特に、自分たちでできないことはすべてRworksにサポートしてもらいたいと思っています。”

シェアードインフラ運用開発グループ長 根本義則氏

疑問、提案、コメントなどはありますか?

私たちの提案は魅力的ですか?