Difference between revisions of "Pandora: Documentation ja: Services"

From Pandora FMS Wiki
Jump to: navigation, search
(No difference)

Revision as of 11:39, 13 June 2012

Pandora FMS ドキュメント一覧に戻る

1 サービスモニタリング

1.1 概要

1.1.1 サービスモニタリングの概念

サービスは、機能に基づいて IT リソースをグループ化する手法です。例えば、サービスは、公式ウェブサイト、CRM システム、アプリケーション、または、プリンタなどです。サービスは、ホストやルータ、スイッチ、ファイアーウォール、CRM、ERP、ウェブやその他サービスの論理的なグループです。以下の例で、サービスとは何かをより明確にします。

Chip Company は、ウェブサイトを通してコンピュータを世界中に販売しています。オンラインショップ、サポート、および管理の 3つの大きな部門があります。

Chip-departments.png

ご覧の通り、オンラインショップ、サポート、直接ではありませんが管理の 3つのサービスが顧客に提供されています。すべてのサービスは、どれか一つが機能しなくなると他に影響が出て会社としての機会損失を発生させるため、ビジネスに重要です。最終的には、満足した顧客は、他の顧客を連れてきます。

Chip Company のサービスをモニタするには、それぞれのサービスの詳細をより知る必要があります。

オンラインショップ部門は、ショップのウェブサイトが稼働し、買い物がしやすいように、すべての製品の価格が正しい状態であること、製品の分類をし製品の情報を提供すること、配送および支払い方法を正しく示すことに責任があります。このサービスでは、次のようなパラメータをモニタリングしたいと考えます。

Operation-detail.png

サポート部門は、顧客が買ったコンピュータに関する全ての問題解決を行います。この部門の業務は、顧客のコンピュータ設定に対するヘルプ、返品されたコンピュータの交換などです。この部門は、オンラインショップと連携し、顧客サイドのサービスを行っています。そのため、高品質な会社であると認識してもらうためにとても重要です。サポートサービスでは、次のようなパラメータをモニタリングしたいと考えます。

Support-service-detail.png

3番目の部門は、マーケティング、広報など、その他内部管理を目的とした管理部門です。彼らの主な業務は、組織におけるすべてのプロセスが正しいかを見ることです。この部門のサービスは、すべての部門のとりまとめであるため、とても重要です。管理サービスのためのパラメータは次の通りです。

Management-detail.png

サービスをモニタするために、Pandora FMS ビジュアルコンソールで Chip Company のサービス構造を説明した画像を使ってマップを作成します。これらのマップは、リアルタイムで更新されるため、常にサービスの状態を知ることができます。最初に作成するマップは、それぞれのサービスのマップです。

次の画像は、それぞれのパラメータのステータスを含むオンラインショップサービスのマップを示しています。ご覧の通り、Content Updated というパラメータが赤くなっています。これは、そこに問題があることを意味しています。他のパラメータは、緑表示になっているため問題が無いといえます。緑の矢印をクリックすると、全体のビューに行くことができます。次のステップで示します。

Screen-onlineshop-detail.png

どんな問題が発生しているかを知りたい場合は、赤いアイコンをクリックします。すると、問題に関してより詳細を知ることができる、技術的な表示を見ることができます。この表示では、Pandora FMS が CRM、ERP、SAP サーバ、データベース (MySQL、Oracle など)、その他サーバやルータ、PC といったデバイスなど多くのソースから収集したデータが示されています。

Agent-detail.png

また、以下に示すようなサポートサービスのマップも作成します。ご覧の通り、サポートサービスの重要なパラメータが表示され、すべてが緑で問題無いことを示しています。

Screen-support-detail.png

最後に、次に示すような管理サービスのマップを作成します。こちらもまた、重要なパラメータが表示され、すべてが緑で問題無いことを示しています。

Screen-management-detail.png

さらに、全てのサービスの全体のマップを作成します。次の画像に示します。このマップでは、Chip Company のそれぞれのサービス状態と構造を見ることができます。また、それぞれのアイコンをクリックすると、それぞれのサービスマップを見ることができます。それぞれのサービスの状態は、それぞれのサービスのマップで見たものと同じで、管理およびサポートサービスには問題がありませんが、オンラインショップサービスには問題が発生しています。ご覧の通り、サービスの状態が構造的にトップまで影響しています。

Screen-chip-overview.png

1.2 Pandora FMS におけるサービス

1.2.1 Pandora FMS でのサービスの動作

Pandora FMS でのサービスのモニタリングは、ある特定の値だけのモニタリングではなく、異なる種類の要素グループのモニタによる複数の障害情報に基づいて実現します。

サービスモニタリングどのように構成されるのか理解しやすいように、例を示します。

我々は、サービスとしてのウェブクラスタが正常かどうかをモニタしたいとします。 このクラスタは、以下の要素から構成されます。

  • HA 構成の 2つのルータ
  • HA 構成の 2つのスイッチ
  • 20 の apache サーバ
  • 4つの Weblogic アプライアンスサーバ
  • 2つのストレージノードと 2つの SQL プロセスノードから成る 1つの MySQL クラスタ

それぞれの要素は個別にモニタリング可能です。実際、最初にサービスモニタリングを有効にする必要がありますが、サービスに含まれるそれぞれの要素は、Pandora で個別にモニタします。これは、サービスモニタリングの前に設定することです。

サービスモニタリングの概念として必要なこととして、このような疑問がでてきます。例えば、20 の apache サーバのうちの一つなど、一つの項目が障害状態だったとしても、全体としては障害では無いのではないだろうか。実際に、よくダウンするとしても 20ノードあるので警告でもないのではないだろうか。1ノードのダウンに対して警告は発するべきではありません (警告が 寝てる誰かを起こすことを考えてください)。実際、サービスは冗長化されており、より安全になっており、緊急作業は不要です。よりクリティカルな要素 (ルータなど) がダウンしたときや、4,5台の複数のウェブサーバダウンしたときに警告を発するべきです。

次のように、それぞれの要素に "ウエイト" を付与します。

  • スイッチおよびルータ: 個々の障害状態の時は 5ポイント、警告状態の時は 3ポイント
  • ウェブサーバ: 個々の障害状態の場合は 1.2 ポイント、警告状態はポイント無し
  • WebLogic サーバ: 個々の障害状態の場合は 2ポイント
  • MySQL クラスタ: それぞれのノードに 5ポイント、警告状態で 3ポイント

サービスを警告状態と判断する閾値を 4、障害状態と判断する閾値を 6 とします。すべてのモニタリング要素が正常であれば、サービスも正常です。

1台の apache サーバダウンが発生した場合は次のようになります。

  • 1 x 障害状態の Apache サーバ x 1.2 ポイント = 1.2 となり、ここで、1.2 < 4 (警告) であるため、サービスの状態はまだ正常です。

ウェブサーバと Weblogic サーバがダウンすると次のようになります。

  • 1 x 障害状態の apache サーバ x 1.2 ポイント = 1.2
  • 1 x 障害状態の Weblogic サーバ x 2 = 2

合計すると 3.2 となり、まだ < 4 です。そのため、サービスの状態はまだ正常です。オペレータが起きる必要はありません。

2台のウェブサーバと、1台の Weblogic サーバがダウンすると次のようになります。

  • 2 x 障害状態の Apache サーバ x 1.2 ポイント = 2.4
  • 1 x 障害状態の Weblogic サーバ x 2 = 2

この場合、4.4 > 4 となり、サービスが警告状態になります。オペレータはまだ緊急の SMS を受信しませんが、少なくとも誰かがメールを受け取ります。引き続き例を見ていきましょう。

上記の状態に加え、1台のルータがダウンすると次のようになります。

  • 2 x 障害状態の Apache サーバ x 1.2 ポイント = 2.4
  • 1 x 障害状態の Weblogic サーバ x 2 = 2
  • 1 x 障害状態のルータ x 5 = 5

合計ポイントは 9.4 となり、障害状態の閾値である 8 を越えています。サービスは障害状態となり、オペレータは起きることになります。

サービスモニタリングは、エンタープライズ版の Pandora FMS のみにある機能です。

1.2.2 新たなサービスの作成

モジュールの関連付けで表現されるサービスの値は、リアルタイムで計算されます。そのため、最初に必要なことは、サービスを構成するデバイスが、正常、警告、障害の 3つの状態を持つようにすることです。これらについてより詳しくは、Pandora FMS でのモニタリング および ポリシーを使ったモニタリング を参照してください。

すべてのデバイスのモニタ設定を行ったあと、サービスとしてそれらをグループ化することができます。それぞれのサービスでは、サービスをモニタするのに必要なモジュールを追加することができます。例えば、オンラインショップサービスをモニタしたい場合、コンテンツやその他通信の状態などをモニタするモジュールが必要です。次のステップでは、Pandora FMS でのサービスの作成の仕方を見ることができます。

新たなサービスを作成するには、システム管理 (Administration) メニューのサービス (service) タブをクリックします。


File:Menu-services.png


サービス一覧が表示されます。以下の例では、サービスが定義されていません。


700px


新たなサービスを作成するのは、作成(Create) ボタンをクリックします。以下に示すフィールドを入力し、サービスを作成します。


700px


この時点では、アイテム無しでサービスが作成されています。そこでサービスにアイテムを追加する必要があります。新たなアイテムを追加するには、サービス管理タブの右上にあるオレンジのスパナアイコンをクリックします。すると、以下のようなフォームが表示されます。 このフォームでは、追加したいエージェントのモジュールを選択する必要があります。また、このモジュールに関する、正常、警告、障害状態に対応するウエイトを入力する必要があります。大きくするとサービス内でより重要となります。


700px


すべてのフィールドに入力したら、作成(Create) ボタンをクリックします。成功メッセージと共に、次のような画面が表示されます。


700px


サービスをモニタするために必要なアイテムを全て追加します。例えば、このサービスでは次の例に示すような要素とウエイトを設定しました。


700px


サービスを作成すると、操作(Operation)メニューのサービス(Service)タブがクリックできます。


File:Service-tab-oper-menu.png


以下に示すように、サービス操作一覧が表示されます。表示内容はリアルタイムで生成され、表示されるパラメータは次の通りです。

  • 名前(Name):サービスの名称です。
  • 説明(Description):サービスの説明です。
  • グループ(Group):サービスが属するグループです。
  • 障害(Critical):サービスが障害状態となる閾値です。
  • 警告(Warning):サービスが警告状態となる閾値です。
  • 値(Value):サービスの値です。リアルタイムで計算されます。
  • 状態(Status):サービスの値や障害状態、警告状態を元にした、サービスの状態です。


700px


サービス名をクリックすると、それのサービスビューが表示されます。サービスの値は、それぞれのモジュールの状態に関連付けられたウエイトの合計で計算されます。サービスモジュールの状態は、その値に関連付けられます。サービスモジュールは、次のパラメータで設定します。

  • エージェント名(Agent Name): モジュールが設定されるエージェントの名前です。
  • モジュール名(Module Name): モジュールの名前です。
  • 説明(Description): 任意の説明です。
  • 障害ウエイト(Weight Critical): モジュールが障害状態となるウエイトです。
  • 警告ウエイト(Weight Warning): モジュールが警告状態となるウエイトです。
  • 正常ウエイト(Weight Ok): モジュールが正常状態となるウエイトです。
  • データ(Data): モジュールの値です。
  • 状態(Status): モジュールの状態です。


700px


すべてのサービスを作成したら、いつでもサービスの状態を表示するビジュアルマップを作成することができます。Pandora FMS のビジュアルマップに関する詳細は、データ表示とレポートを参照してください。

このツールで、概要で示した Chip Company のサービスを説明するマップを作成しています。以下に Chip Company のサービスのマップを示します。

Screen-chip-overview.png

さらに、より技術的なマップが必要であれば、Pandora FMS のビジュアルマップコンソールでより詳細なマップを作成することもできます。アイコン、グラフ、状態を示すアイコン、タグ、データ等を追加できます。以下の画像では、全てのデバイスの状態を含むオンラインショップサービスの技術マップを示します。


700px


1.2.3 サービスグループ

サービスは、企業のビジネスにおける要素となる論理的なグループとして考えることができます。サービス単体では全体を表現できないため、サービスのグループを作成する必要があるでしょう。サービスグループを作成するには、既存のエージェントにそれぞれのサービスを追加する必要があります。この場合、サービスはエージェントのモジュールになります。

これらのグループは、ビジュアルマップの作成、アラートの設定、モニタリングポリーの適用などの助けになります。ERP において技術的問題が発生したために、営業の人が業務を出来なかったり、ある拠点が業務を出来ないというような、企業としてのクリティカルな状態の時に、アラームを実行するアラートを作成することができます。

より解りやすいように、以下にサービスグループの例を 2つ示します。

1.2.3.1 同一企業内の複数サービス

前述の例で、セールスマンが WEB サービスを顧客に売り、顧客管理に CRM にアクセスすると仮定します。

我々の CRM サービスは次のシステムから成り立っています。

  • HA 構成の 2つのルータ
  • 2台の Apache ウェブサーバ
  • データノード 2台、SQL ノード 2台の MySQL クラスタ

例えば、CRM サービスを作成して、CRM アーキテクチャが監視されていると仮定します。

この時、2つのサービスが存在します。

  1. ウェブクラスタサービス (顧客向け)
  2. CRM サービス (営業部門向け)

Servicios separado.jpeg

サービスグループを使う最も良いオプションとしては、クラスタサービスと CRM サービスを茂モジュールとして持つ "Company" といった名前の新たなエージェントを作成することです。つまり、サービスは、このような方法でグループ化します。

Servicios compania.jpeg

1.2.3.2 複数拠点での異なるサービス

他の例として、それぞれのサービスを提供している企業の異なる拠点をモニタするとします。

例えば、3拠点で CRM、ERP および内部ウェブのサービスがあるとします。サービスは、それぞれの拠点ごとのニーズで設定されています。ここで、それぞれの拠点のサービスを次の図のようにモニタリングします。

Servicios sedes separado.jpeg

しかし、Pandora FMS 内で、企業の組織に近い形で、それぞれの拠点のサービスをグループ化して表現するロジックが必要です。そうするためには、それぞれの拠点ごとに、それぞれのサービスをモジュールとして持つエージェントを作成します。この方法を使うと、次のようなグループになります。

Servicios sedes agrupados.jpeg

サービスをグループ化するこのような方法で、Pandora FMS 内に実際の構造を論理的に表現することができます。これで、全てのサービスをモニタリングすることができます。