アプリケーション内の問題を検出して通知する機能は、最適な総合的耐障害性ソリューションを構築する上で非常に重要です。すべての個々のアプリケーションは、障害発生のメカニズムと形式によって異なるため、一般的なメカニズムを示すことはできません。ただし、一般的に、多くのアプリケーションの設定は、LifeKeeper Single Server Protection に用意されている Core システムのエラー検出機能を利用することができます。このトピックでは、LifeKeeper Single Server Protection Core の機能について説明します。
アプリケーションに障害が発生したときに LifeKeeper Single Server Protection が障害を検出しリカバリを実行する仕組みを説明したリカバリシナリオを以下に示します。
- LifeKeeper Single Server Protection は最初に、アプリケーションを再起動することでリカバリを試みます。
- リカバリが成功した場合、アプリケーションは正常動作を継続します。
- リカバリに失敗した場合、以下の処理が実行されます。
a. LifeKeeper Single Server Protection が HA を有効 (/etc/default/LifeKeeper で HA_DISABLE=0) にした VMware ゲスト OS にインストールされている場合にリカバリに失敗すると、LifeKeeper Single Server Protection がアプリケーション監視インターフェースに送信するハートビートを抑制することで VMware HA がトリガされます。VMware HA はサーバを再起動することで応答します。
b. LifeKeeper Single Server Protection が VMware ゲスト OS にインストールされていないか、HA を無効 (/etc/default/LifeKeeper で HA_DISABLE=1) にした VMware ゲスト OS にインストールされている場合にリカバリに失敗すると、システムが強制的に再起動されます。
このトピックへフィードバック