ダウンタイムは顧客の売り上げと利益に直結するため、問題を素早く解決することが重要です。 24時間365日稼働し続けなければならないシステムであれば、問題がいつどこで発生しているかを知る必要があります。

今回、我々は問題解決までの時間を短縮するために PagerDuty との統合を行いました。 もしシステムが午前2時にダウンしたとすると、問題をすぐに解決するよう PagerDuty アラートがあなたを起こします。

Pandora FMS は、インフラ監視におけるすべての目的に対して利用できる監視ソフトです。何か障害を検知した場合にある条件下でアラートシステムによりアクションを実行することができます。

PagerDuty は、任意の監視ツールからのアラートを集約し、個別の通知ルールに従って業務上正しい人にそれを渡すことができるインシデント管理のソリューションです。

統合のおかげで、Pandora FMS からのアラートは PagerDuty に送られ、PagerDuty が音声、SMS、emailおよびプッシュ型のアラート発報を行います。 もしプライマリの担当者が受け取れなかった場合は、受け取ってもらえるまで他のチームメンバーへ通知されます。 PagerDuty はまた、呼び出しのスケジューリングも可能で、ユーザ、場所、デバイスに制限なく、呼び出し先のローテーションも可能です。

esquema_pagerduty

 

統合はとてもシンプルで、Pandora FMS のアラートで実行するスクリプトで行います。 このスクリプトは、インシデントの作成およびクローズのために、PagerDuty の Web API を呼び出します。

  • Pandora FMS でのアラートの発生 -> PagerDuty で新規インシデントが作成される (状態: Triggered)
  • Pandora FMS でアラートの復旧 -> このアラートにリンクした PagerDuty のインシデントはクローズされる (状態: Resolved)

Pandora FMS と PagerDuty の統合により、Pandora FMS のアラートが正しい人に届くようになり、すばやく問題を解決することができます。

公式な統合ガイドはこちらから参照できます。

Shares