説明
LifeKeeperでスプリットブレイン対策をしていている場合でも、すべてのコミュニケーションパスが切断され、アクティブノードがQuorumを失ったケースでは、フェイルオーバー後のコミュニケーションパス復旧時にDataKeeperのボリュームリソース(ミラーボリューム)が、「スプリットブレイン状態」になる現象が発生する場合があります。
原因
LifeKeeperのQuorum/Witnessを有効にしている環境で、すべてのコミュニケーションパスが切断され、アクティブノードがQuorumを失ったケースでは、アクティブノードで「OSU」アクションを実行します。しかし、コミュニケーションパスが切断されてからOSUアクションが完了するまでの間はDataKeeperのボリュームリソースはソースとして動作し続けます。一方、対向ノードがQuorumを獲得した場合にはフェイルオーバーを実行します。このとき、DataKeeperのボリュームリソースはコミュニケーションパスが切断される直前の状態からソースとして動作を開始します。その結果、タイミングによっては両ノードで別々のデータが書き込まれた状態になる場合があります。ここでコミュニケーションパスが復旧すると、DataKeeperは「スプリットブレイン状態」と判定します。この状態になると、どちらのシステムのデータを採用するかをユーザーの判断にゆだねる必要があります。
推奨される処置
LifeKeeper GUIよりSplit Blain Recoveryを実施してください。



このトピックへフィードバック