DataKeeper ミラーボリュームリソースを持つ LifeKeeper for Windows クラスターのノードをリプレースする場合、以下の変更を行います
- DataKeeper ボリュームリソースを、リプレースされるノードからクラスター内の別のノードに移動します。
- レジストリーエディタを使用して、ミラーリングされた各ボリュームの DataKeeper ジョブからリプレース対象のノードを削除します。 1×1 ミラー (2 ノード クラスター) の場合は、DataKeeper ジョブを削除します。
- ミラーリングされたボリュームごとに、EMCMD を使用して、ソースシステムからリプレースされるターゲットノードへのミラーを削除します。
- クラスターからノードを削除します。
- バージョン 8.9.0 以降 – delallsys.pl ユーティリティを使用してシステムを削除します。
- 8.9.0 より前のバージョン – LifeKeeper 構成データベースからコミュニケーションパス、等価物、およびシステムを手動で削除します。
- リプレース先のノードを起動します。
- DataKeeper GUI を使用して、新しいノードへのミラーを再作成します。
- LifeKeeper クラスターにノードを追加します。
ノードのリプレースを行うには、わずかに異なる手順が必要な 2 つのケースがあります。 1 つ目のケースは、クラスターノードを失って回復できない場合です。2 つ目は、ノードのリプレースが計画されているものの、リプレース作業前はまだ稼動しているケースです。
これら 2 つのケースには、わずかに異なる手順が必要な 2 つのシナリオがあります。 1 つ目のシナリオは、クラスター化されたボリュームごとに 1 つのミラーを備えた 2 ノードクラスターです。 2 つ目のシナリオは、3 ノード クラスター、またはクラスターの外側にノードがある 2 ノード クラスターです。
Case 1 – ノードが失われ、回復できない
シナリオ 1: クラスター外にノードを持たない2ノードクラスター
この例では、2 ノードの DKCE クラスターがあります。 クラスターノードは次のとおりです。
- W16-1
- W16-2
E:とF:の2つのミラーボリュームがあります。
ノード W16-2 は失われており、復旧できません。 これはリプレースされ、W16-2 という名前の新しいノードに置き換えられます。
Step 1 – DataKeeper ボリュームリソースを、リプレースされるノードからクラスター内の別のノードに移動する
LifeKeeper 階層はノード W16-1 で稼働しています。
Step 2 – レジストリーエディターを使用して、ミラーボリュームを含むジョブを削除する
DataKeeper ジョブは、Windows レジストリーの次のレジストリーキーに保存されます。
HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\ExtMirr\Parameters\Jobs
レジストリーエディターを起動し、このキーに移動します。
各 DataKeeper ジョブには ID があり、 “Jobs” キーのサブキーとして表示されます。 たとえば、このシステムには2つのジョブ “E” と “F” があります。ジョブ IDは、 “emcmd . getjobinfo” コマンドの出力に表示されます。
|
---|
レジストリーには、2 つのジョブ ID が表示されます。
クラスターの一部ではないミラーリングされたボリュームに関する情報が含まれていない限り、各ジョブを削除する必要があります。 ジョブを削除するには、名前がジョブ ID であるキーを右クリックし、[削除] を選択します。 これにより、このシステムの DataKeeper からジョブが完全に削除されます。
注意: 一部の DataKeeper ジョブには、複数のボリュームの情報が含まれています.
クラスターノードの 1 つでこの手順を完了したら、他のすべてのクラスターノードでこの手順を繰り返します。
Step 3 -ミラーボリュームごとに EMCMD を使用して、ソースシステムからリプレース対象のターゲットノードへのミラーを削除する
EMCMD を使用してミラーを削除するには、ミラーソースノードでCMDプロンプトを開始します。 次にコマンド “cd /d %ExtMirrBase%” を使用して、ディレクトリをDataKeeperインストールディレクトリに変更します。
削除されるノードをターゲットとするミラーを削除するには、次のコマンドを実行します。
emcmd . deletemirror <vol>
この場合、次のコマンドを実行します。
C:\Program Files (x86)\SIOS\DataKeeper>emcmd . deletemirror f |
---|
Step 4 – クラスターからノードを削除する
この時点で、ノードはDataKeeperから完全に削除されています。 リプレースプロセスの次のステップは、クラスターからノードを削除することです。
8.9.0 より前のバージョンのノードを手動で削除します
コマンド: delallsys [-f] [-e] <sys>
[-f] | 項目を強制的に削除します — このオプションを使用しないと、何も削除されません。 最初にこれを使用せずに実行して、このコマンドが何を削除するかを確認してください。 |
[-e] | コミュニケーションパスではなく、イクイバレンシのみを削除します |
<sys> | すべてのリソースの <sys> へのイクイバレンシとコミュニケーションパスを削除します。 ここで <sys>はクラスターから永久に外され、リプレイスされるノードです。 |
注意: このユーティリティを実行するには、LifeKeeperが実行されている必要があります。
注意: このコマンドは細心の注意を払い、SIOSサポートチームの指示の下でのみ実行してください。 ご質問がある場合は、サポートまでお問い合わせください。
LifeKeeper のバージョンが 8.9.0 以降の場合、delallsys.pl ユーティリティは LifeKeeper に含まれています。 このツールを使用するには、次の手順に従います。
- CMDプロンプトを開きます。
- “cd /d %LKBIN%” コマンドを実行して、ディレクトリーを LifeKeeper bin ディレクトリーに変更します。
- コマンド “sh” を実行してシェルセッションを開始します。
- “export PATH=$PATH:/bin” マンドを使用してPATHを設定します。
- コマンド “perl delallsys.pl -f <node name>” を実行して、delallsys.pl スクリプトを実行します。
- “exit” を実行してCMDプロンプトに戻ります。
|
---|
8.9.0 より前のバージョンのノードを手動で削除します
LifeKeeper のバージョンが 8.9.0 より前の場合は、LifeKeeper システムを構成データベースから手動で削除する必要があります。 これを行うには、次の手順に従います。
- CMDプロンプトを開きます。
- “cd /d %LKBIN%” コマンドを実行して、ディレクトリーを LifeKeeper bin ディレクトリーに変更します。
- イクイバレンシを削除します。
- “eqv_list” を実行して、イクイバレンシリストを取得します。リプレースされるノードを含む、すべてのノードを識別します (W16-3)。
|
---|
b. For each instance tag (Vol.E, 17.17.17.17, and Vol.F in this case), find the local tag (the second item in each entry, after the “” character) and the remote tag (the 4th item). Run the command “eqv_remove -t <localtag> -S <node being removed> -o <remotetag> -e <instancetype>.
|
---|
c. Verify that eqv_list output is now empty
|
---|
- Remove LifeKeeper communication paths to the node being replaced
- Run “net_list” to get a list of communication paths. Identify all of the paths that contain the node being replaced (W16-3):
|
---|
b. For each communication path to be removed, get the device name (the 2nd item in the list after the “▯” character). Run the command “net_remove -D <devicename>” to delete the communication path. Then run “net_list” to verify that the communication path has been removed.
|
---|
- Remove the node from the list of LifeKeeper systems by running “sys_remove -s <node being removed>”. Verify that the system was removed by running “sys_list”
|
---|
Step 5 – Bring up the replacement node and add it to the cluster
Configure the new node, adding storage as appropriate. Then add it to the cluster.
Step 6 – Use the DataKeeper GUI to re-create mirrors to the new node
Start the DataKeeper GUI, connect to the new node, and create a mirror to it within the appropriate job.
SCENARIO 2: Three-or-more-node cluster, or two node cluster with 1 or more nodes outside the cluster
In this example, there is a three-node DKCE cluster. The cluster nodes are:
- W16-1
- W16-2
- W16-3
There are two mirrored volumes – E: and F:.
Node W16-3 has been lost and is not recoverable. It will be replaced with a new node, also named W16-3.
Step 1 – Move any DataKeeper Volume resources from the node being replaced to another node in the cluster
LifeKeeper hierarchies are in service on node W16-1.
Step 2 – Using the registry editor, remove the node being replaced from the DataKeeper job for each mirrored volume.
DataKeeper Jobs are stored in the Windows registry. To modify a job that is configured on a node that is not accessible, update the registry values associated with the job.
DataKeeper Jobs are stored in the following registry key:
HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\ExtMirr\Parameters\Jobs
Start the registry editor and navigate to that key.
Each DataKeeper job has an ID, which you’ll see as a subkey in the “Jobs” key. For example, on this system there are two jobs “E” and “F”. The job ID is listed in the output of the “emcmd . getjobinfo” command:
|
---|
The registry shows the two Job IDs. Navigate into one of them – you will see that it contains 3 values: Name, Description, and Endpoints.
To remove a node from a job, the Endpoints value needs to be modified. Double-click the Endpoints value and find any lines containing the node that is to be removed.
In this case, the 2nd and 3rd lines should be removed. Highlight them and press the Delete button, then “OK” to save the value. In this case, it should have a single line left (for the mirror between W16-1 and W16-2).
Repeat these steps for all jobs. When completed, “emcmd . getjobinfo” will reflect the new job contents:
|
---|
Note: Some DataKeeper jobs contain information for more than one volume. In those cases, the same steps should be followed – remove any lines that contain references to the node being removed.
After completing this step on one of the cluster nodes, repeat it on all other cluster nodes. An alternative is to export the “Jobs” key to a file, and import that key on each of the other nodes. This ensures that job information is consistent across the nodes.
Step 3 – For each mirrored volume, use EMCMD to delete mirrors from the source system to the target node which is being replaced
To delete a mirror using EMCMD, start a CMD prompt on the mirror source node. Then change directory to the DataKeeper install directory using the command “cd /d %ExtMirrBase%”.
To delete the mirror whose target is the node being removed, run the command:
emcmd . deletemirror <vol> <target_ip>
using the volume letter and IP address of the node being removed. In this case, run the commands:
|
---|
Step 4 – Remove the node from the cluster
At this point, the node has been completely removed from DataKeeper. The next step in the replacement process is to remove the node from the LifeKeeper cluster.
Version 8.9.0 and later – use delallsys.pl
If your LifeKeeper version is 8.9.0 or later, the delallsys.pl utility is included with LifeKeeper. To use this tool, follow these steps.
- Open a CMD prompt
- Change directory to the LifeKeeper bin directory by running the command “cd /d %LKBIN%”
- Start a shell session by running the command “sh”
- Set PATH using the command “export PATH=$PATH:/bin”
- Run the delallsys.pl script by running the command “perl delallsys.pl -f <node name>”
- Run “exit” to return to the CMD prompt
|
---|
Repeat these steps on all remaining LifeKeeper nodes (W16-2 in this case).
Versions prior to 8.9.0 – manually remove the node
If your LifeKeeper version is earlier than 8.9.0, the LifeKeeper system must be manually removed from the configuration database. To do this, follow these steps:
- Open a CMD prompt
- Change directory to the LifeKeeper bin directory by running the command “cd /d %LKBIN%”
- Remove equivalencies:
- Run “eqv_list” to get a list of equivalencies. Identify all of the ones that contain the node being replaced (W16-3):
|
---|
b. For each instance tag (Vol.E, 17.17.17.17, and Vol.F in this case), find the local tag (the second item in each entry, after the “” character) and the remote tag (the 4th item). Run the command “eqv_remove -t <localtag> -S <node being removed> -o <remotetag> -e <instancetype>.
|
---|
c. Verify that eqv_list now does not include the node being removed:
|
---|
- Remove LifeKeeper communication paths to the node being replaced
- Run “net_list” to get a list of communication paths. Identify all of the paths that contain the node being replaced (W16-3):
|
---|
b. For each communication path to be removed, get the device name (the 2nd item in the list after the “▯” character). Run the command “net_remove -D <devicename>” to delete the communication path. Then run “net_list” to verify that the communication path has been removed.
|
---|
- Remove the node from the list of LifeKeeper systems by running “sys_remove -s <node being removed>”. Verify that the system was removed by running “sys_list”
|
---|
Repeat these steps on each remaining node in the cluster.
Step 5 – Bring up the replacement node
Configure the new node, adding storage as appropriate.
Step 6 – Use the DataKeeper GUI to re-create mirrors to the new node
Start the DataKeeper GUI, connect to the new node, and create a mirror to it within the appropriate job.
Step 7 – Add the node to the LifeKeeper cluster
Create comm paths from the existing LifeKeeper nodes to the new replacement node, then extend all hierarchies.
Case 2 – node is running and can be accessed prior to being replaced
If you are planning to replace a cluster node with a new one, the steps are very similar to what is done for Case 1 – node is lost and not recoverable. The steps are – before shutting down the node to be replaced:
- Move any hierarchies from the node being replaced to another node in the cluster
- Shut down the node that is going to be replaced. After this point, do NOT re-start this node, since it will have invalid mirror and job configuration.
- Follow the steps described in Case 1 – node is lost and not recoverable.
このトピックへフィードバック