アプリケーション内の問題を検出して通知する機能は、最適な総合的耐障害性ソリューションを構築する上で非常に重要です。すべての個々のアプリケーションは、障害発生のメカニズムと形式によって異なるため、一般的なメカニズムを示すことはできません。ただし、一般的に、多くのアプリケーションの設定は、LifeKeeper Single Server Protection に用意されている Core システムのエラー検出機能を利用することができます。このトピックでは、LifeKeeper Single Server Protection Core の機能について説明します。
アプリケーションに障害が発生したときに LifeKeeper Single Server Protection が障害を検出しリカバリを実行する仕組みを説明したリカバリシナリオを以下に示します。
- LifeKeeper Single Server Protection は最初に、アプリケーションを再起動することでリカバリを試みます。
- リカバリが成功した場合、アプリケーションは正常動作を継続します。
- リカバリに失敗した場合、以下の処理が実行されます。
a. LifeKeeper Single Server Protection が HA を有効 (/etc/default/LifeKeeper で HA_DISABLE=0) にした VMware ゲスト OS にインストールされている場合にリカバリに失敗すると、LifeKeeper Single Server Protection がアプリケーション監視インターフェースに送信するハートビートを抑制することで VMware HA がトリガされます。VMware HA はサーバを再起動することで応答します。
b. LifeKeeper Single Server Protection が VMware ゲスト OS にインストールされていないか、HA を無効 (/etc/default/LifeKeeper で HA_DISABLE=1) にした VMware ゲスト OS にインストールされている場合にリカバリに失敗すると、システムが強制的に再起動されます。
必要に応じて、LifeKeeper Single Server Protection を 通知のみ モードにすることができます。このモードでは、システム再起動の自動トリガは無効になります (以下の VMware HA と通知のみモードセクションを参照)。 通知のみ モードでは、ユーザがシステムにログインし、障害の原因になった問題を修正する必要があります。
VMware HA と通知のみモード
- VMware ゲスト OS で HA が有効にされ、LifeKeeper SSP vCenter プラグイン がインストールされた 通知のみ モードでは、障害が検出された場合、LifeKeeper Single Server Protection はアプリケーションの再起動を行いません。その代わりに、リソースは [Failed] とマークされます。vCenter プラグイン ダッシュボードのステータス表示画面には障害が表示されます ( [Application Status] : [Failed] )。
- サーバにログインして、障害の原因になった問題を修正します。
- CLI を使用するか、 vSphere Client ユーザインターフェース 内の保護対象仮想マシンをクリックして、 LifeKeeper 管理コンソール を開いてください。
- アプリケーションを In Service に戻します。
- vSphere Client ユーザインターフェース 内の ダッシュボード 表示に移動します。
- [Refresh] をクリックします。 [Application Status] は [Active] に戻ります。
このトピックへフィードバック