説明

LifeKeeperでスプリットブレイン対策をしていている場合でも、すべてのコミュニケーションパスが切断され、アクティブノードがQuorumを失ったケースでは、フェイルオーバー後のコミュニケーションパス復旧時にDataKeeperのボリュームリソース(ミラーボリューム)が、「スプリットブレイン状態」になる現象が発生する場合があります。

原因

LifeKeeperのQuorum/Witnessを有効にしている環境で、すべてのコミュニケーションパスが切断され、アクティブノードがQuorumを失ったケースでは、アクティブノードで「OSU」アクションを実行します。しかし、コミュニケーションパスが切断されてからOSUアクションが完了するまでの間はDataKeeperのボリュームリソースはソースとして動作し続けます。一方、対向ノードがQuorumを獲得した場合にはフェイルオーバーを実行します。このとき、DataKeeperのボリュームリソースはコミュニケーションパスが切断される直前の状態からソースとして動作を開始します。その結果、タイミングによっては両ノードで別々のデータが書き込まれた状態になる場合があります。ここでコミュニケーションパスが復旧すると、DataKeeperは「スプリットブレイン状態」と判定します。この状態になると、どちらのシステムのデータを採用するかをユーザーの判断にゆだねる必要があります。

推奨される処置

LifeKeeper GUIよりSplit Blain Recoveryを実施してください。

フィードバック

お役に立ちましたか?

はい いいえ
お役に立ちましたか
理由をお聞かせください
フィードバックありがとうございました

このトピックへフィードバック

送信