サーバー上のすべてのコミュニケーションパスが切断された場合、LifeKeeper for Windows は対向先に障害が発生しているとみなし、フェイルオーバーを実行します。ただしそのときに、この障害がコミュニケーションパスだけではなく、サーバーで発生したことを確認するためにセーフティチェックを実行します。
セーフティチェックは、LAN Manager を使用して、ネットワーク上にまだマシンが存在するかどうかを確認します。その際、以下の2つのイベントのうちどちらかが発生します。
- システムが稼働している場合: セーフティチェックにより、サーバーがネットワークに接続していることが確認された場合、COMM_DOWN イベントを一時停止して、少なくとも1つのコミュニケーションパスが回復するのを待ちます。
SAFETY CHECK DETECTED MACHINE "Target System Name":PAUSING COMM_DOWN
The remote node (Target System Name) appears to be reachable. Waiting for confirmation.
少なくとも1つのコミュニケーションパスが再び ALIVE になった場合、次の2つのメッセージがログに記録されます。
SAFETY CHECK ABORTED:ABORTING COMM_DOWN
The remote node (target system name) is up.
この場合、フェイルオーバーは発生せず、COMM_DOWN イベントは終了します。
- システムが停止している場合: すべてのコミュニケーションパスが切断されたままの場合、最終的にセーフティチェックがタイムアウトし、以下のようにログに記録されます。
SAFETY CHECK for "Target System Name" timed out: assuming "Target System Name" is down
この場合、フェイルオーバーが発生します。
LifeKeeper for Windows はすべてのコミュニケーションパスが切断した際に、セーフティチェックを 1 度だけ実行します。セーフティチェックでシステムが ALIVE であることが検出されると、フェイルオーバーが中止されます。LifeKeeper for Windows は、以下のすべてのイベントが順番に発生するまで、フェイルオーバーを再実行しません。
- 少なくとも1つのコミュニケーションパスが ALIVE に戻る。
- すべてのコミュニケーションパスが再び DEAD になる。
- セーフティチェックが作動し、対向先が ALIVE の状態であることを検出できない。
このトピックへフィードバック