このセクションでは、DataKeeper for Linux の使用時に遭遇する可能性がある問題に関する情報を示します。必要に応じて、エラーの原因およびエラー状態を解消するために必要な処置についても説明しています。
DataKeeper for Linux に固有のメッセージについては、DataKeeper メッセージカタログ を参照してください。他の LifeKeeper コンポーネントからメッセージが送出されることもあります。その場合は、総合メッセージカタログ を参照してください。これらのメッセージカタログには、LifeKeeper for Linux の使用中に遭遇される可能性のあるすべてのエラーコード (操作、管理、および GUI に関するものを含む) の一覧があります。また、エラーコードの原因に関する追加の説明や、問題解決のために必要な処置についても、必要に応じて記載されています。この一覧から、受信したエラーコードを検索できます。また、該当する LifeKeeper コンポーネントの個別のメッセージカタログに直接アクセスすることもできます。
以下の表に、予測される問題と推奨される処置を示します。
症状 | 推奨される処置 |
---|---|
プライマリーサーバー上でリソースがIn Serviceとなっていない場合、左端のリソースアイコンでミラー固有のアクション (再開、一時停止、強制ミラーオンライン) を選択すると失敗する。 | サーバー固有のアイコンを選択して操作を実行します。 |
GUI に[Wait to Resync]が表示される。 | 再同期処理は親リソースが In Service になるまで待機します。LifeKeeper のログは、再同期処理の開始を妨げているリソースと、どのリソースが起動される必要があるかを示したメッセージを含みます。リソースが 単純に OSU になっているのであればリソースを In Service にするか ログメッセージに記載されている mirror_action コマンドを実行してください。リソースが OSF の場合は、リソースを In Service にする前に問題を解決することで、データの再同期が行われます。詳細については 再同期前のデータ検証 を参照してください。 |
LKCLI のエクスポート/インポート機能を用いて、DataKeeper リソースのミラーリング方式がノード毎に異なるようなリソースを作成することはできません | GUI を用いて DataKeeper リソースを作成した場合、プライマリーからセカンダリー間を非同期転送、セカンダリーからプライマリー間を同期転送する設定が出来ますが、その構成をLKCLIでエクスポートした場合に別のクラスター構成にインポートすることはできません。 注記: この構成は、lkcliのエクスポート/インポート機能ではサポートされていません。lkcliのエクスポートはエラーを返しませんが、lkcliのインポートは失敗します。 |
netraid ミラーに一意の識別子がないという警告メッセージ |
一意の識別子を使用するには、設定をできるだけ早く変更する必要があります。 # ins_list -r netraid -f: | grep DEVNAME | grep -v mapper | cut -f4,5 -d: 注記: これは netraid「tag:ID」のリストです。以下の手順では、上記のデバイス名マッピングの一致を想定しています。 3. デバイスが GPT で設定されているかどうかを確認します。各デバイスについて、GPT getId を実行します。 #/opt/LifeKeeper/lkadm/subsys/scsi/gpt/bin/getId -i /dev/xvdb 4. getId が一意の ID を返した場合は、インスタンスを更新します。 #ins_setid -t datarep-test1 -i “4757cd62-e065-4013-8514-1031b446aa24” <GPT ではないデバイスがある場合は、ステップ5 に進んでください。> 5. 安全でない netraid リソースに依存するリソースを特定します。 # ins_list -r netraid -f: | grep DEVNAME | grep -v mapper | cut -f4 -d: | while read entry; do dep_list -p $entry -f: 2>/dev/null | cut -f1 -d:; done 注記: これは、netraid デバイスに関連付けられたファイルシステムの タグのリスト です。 6. ファイルシステムのマウントポイントを特定します。通常、ファイルシステムリソースのタグはマウントポイントと同じです。同じでない場合は次のコマンドを使用して、ファイルシステムタグをファイルシステムのマウントポイントと一致させることができます。 # ins_list -t filesys3 -f: | cut -d: -f5 7. すべてのアクティビティーを停止して、ファイルシステムリソースのみを netraid デバイスで In Service にします。 a. すべてのリソースを Out of Service にします。 安全でないデバイスについてのみ、以下の手順に従ってください。 8. リソースが In Service で影響を受けるファイルシステム上のすべてのデータのバックアップを取得します。 9. すべてのクラスターノードですべてのリソースを Out of Service にします。 10. LifeKeeper 構成のバックアップを取得します(lkbackup -c --cluster)。 11. 安全でない各 netraid リソースに対して階層を削除します。 a. 階層に注意してください。影響を受けるアプリケーションは削除されます。 12. この時点で残っているのは、安全でない netraid リソースとの依存関係がないリソースのみです。ほとんどの場合、それは IP リソース、EC2 リソースなどです。 13. すべてのノードで lkstop を実行します。 14. 影響を受けるすべてのファイルシステムがアンマウントされていることを確認します。 15. 各ノードのデバイスを GPT パーティションテーブル(gdisk や parted などを使用)で再構成するか、LVM を使用します。 16. すべてのノードで LifeKeeper を起動します。 17. ファイルシステムごとにレプリケートされた新しいファイルシステムを作成し、各リソースをすべてのノードに拡張します。 • /dev/xvdb1 -> /test1 18. バックアップから各マウントポイントにデータをリストアします。データは自動的にターゲットに再同期されます。 19. ステップ 11 で削除したアプリケーション階層を再作成します。 DataKeeper ストレージ構成オプションの詳細については、SIOS製品ドキュメント を参照してください。 |
DataKeeper リソースを削除した後に NetRAID デバイスが削除されない。 | NetRAID デバイスがマウントされている場合、DataKeeper リソースを削除しても NetRAID デバイスは削除されません。手動でデバイスをアンマウントした後、以下のコマンドを使用してNetRAIDデバイスを削除することができます。 mdadm -S <md_device> (<md_device> を調べるには cat /proc/mdstat) |
フェイルオーバー中のエラー | デバイスのステータスを確認してください。再同期が進行中の場合、フェイルオーバーは実行できません。 |
プライマリーサーバーに障害が発生すると、セカンダリーサーバーの DataKeeper リソースが ISP になります。ただし、プライマリーサーバーが再起動すると、両方のサーバーで DataKeeper リソースが OSF になります。 | DataKeeper リソース階層の作成時に選択した「スイッチバックタイプ」を確認してください。このリリースでは、DataKeeper リソースの自動スイッチバックはサポートされていません。リソースプロパティーのウィンドウで、スイッチバックタイプを [Intelligent] に変更できます。 |
両方のサーバーが動作不能になってからプライマリーサーバーが再起動したときに、リソースを ISP にすることができない。 | セカンダリーサーバーよりも前にプライマリーサーバーが動作可能になった場合、DataKeeper リソースを強制的にオンラインにすることができます。このためには、リソースプロパティーのダイアログを開き、 [Replication Status] タブ、 [Actions] ボタンを順にクリックし、次に [Force Mirror Online] を選択してください。 [Continue] をクリックして確認してから、 [Finish] をクリックしてください。 |
現在マウントしている NFS ファイルシステムに DataKeeper 階層を作成するときのエラー | 現在 NFS がエクスポートしたファイルシステムに、DataKeeper 階層を作成しようとしています。エクスポートする前に、このファイルシステムをレプリケーションする必要があります。 |
DataKeeper リソース作成時の GUI のウイザードに、新しく作成したパーティションがリストされない。 | Linux OS は、システムを次回再起動するまで、新しく作成したパーティションを認識しないことがあります。新しく作成したパーティションのエントリーを調べるには、/proc/partitions ファイルを表示してください。新しく作成したパーティションがこのファイルに表示されない場合、システムを再起動する必要があります。 |
プライマリーとバックアップの両方のサーバーで、リソースが緑(ISP)で表示される。 | これは、「スプリットブレイン」のシナリオで、一時的な通信障害により発生することがあります。通信の再開後、両方のシステムがそれぞれ、それ自体をプライマリーと見なします。 いずれのシステムが最終のプライマリーシステムであったかが不明なので、DataKeeper はデータを再同期しません。手動操作が必要です。 ビットマップを使用しない場合 : 最終のバックアップであったサーバーを特定し、そのサーバーのリソースをサービス休止にする必要があります。その後、DataKeeper が全体の再同期を実行します。 ビットマップを使用する場合 : 最終のバックアップであったサーバーを特定し、そのサーバーのリソースをサービス休止にする必要があります。その後、DataKeeper が部分的な再同期を実行します。 |
Core – 言語環境の影響 | LifeKeeper の一部のスクリプトは Linux のシステムユーティリティーの出力を解析し、情報を抽出するために特定のパターンに依存します。英語圏以外のロケールで一部のコマンドが実行されている場合、予測されたパターンは変更され、LifeKeeper スクリプトは必要な情報の取得に失敗します。このため、 /etc/default/LifeKeeper では、言語環境変数 LC_MESSAGES が POSIX「C」のロケール (LC_MESSAGES=C) に設定されています。言語を英語にして Linux をインストールする必要はありません (インストールメディアで使用できる任意の言語を選択可能)。 /etc/default/LifeKeeper の LC_MESSAGES の設定は LifeKeeper にのみ影響します。 /etc/default/LifeKeeper の LC_MESSAGES の値を変更する場合は、LifeKeeper の動作に悪影響を及ぼす可能性があることに注意してください。悪影響は、メッセージカタログがさまざまな言語とユーティリティーに対応してインストールされているかどうか、および LifeKeeper が予期していないテキスト出力をそれらが生成するかどうかに左右されます。 |
GUI – GUI の終了後に Web ブラウザから再接続したときに、GUI のログインプロンプトが再表示されないことがある。 | GUI アプレットを終了するか切断してから、同じ Web ブラウザのセッションから再接続しようとすると、ログインプロンプトが表示されないことがあります。 回避策: Web ブラウザを閉じ、Web ブラウザを開き直してからサーバーに接続します。Firefox ブラウザを使用している場合は、Firefox のウィンドウをすべて閉じてから、開き直します。 |
DataKeeper リソースの作成 (および拡張) に失敗する | 特定の環境(IDE ディスクエミュレーションを使用した仮想化環境、HP CCISS ストレージを使用したサーバー、ソリッドステートデバイス(SSD)、Amazon EBS ストレージなど)で DataKeeper を使用している場合、ミラー作成時にエラーが発生することがあります。 これは、LifeKeeper が問題のディスクを認識せず、デバイスに関連付ける一意の ID を取得できないためです。 回避策: GUID パーティションを作成し、一意の ID をパーティションに割り当てるか、LVM を使用してください。 |
アップグレード後、ターゲットの状態が「Out of Sync」になる | LifeKeeper 9.2.2 以降では NU デバイスの使用を推奨していないため、NU デバイスで構成された DataKeeper リソースが存在する環境では、このような症状が発生します。 NU デバイスを使用した環境で LifeKeeper 9.2.2 以降にアップグレードする場合には、 /etc/default/LifeKeeper に以下の設定を追加してください。 LKDR_ALLOW_NU=TRUE |
ターゲットに拡張しても、非同期または同期を設定するための「Replication Type」の入力画面が表示されない。 | ミラーが作成されると、[Enable Asynchronous Replication(非同期レプリケーションを有効にする)] で [no] が選択されました。ミラーを削除し、[Enable Asynchronous Replication(非同期レプリケーションを有効にする)] プロンプトが表示されたら [yes] を選択してください。 |
レプリケーションタイプが同期ではなく非同期になっている。2つのシステム間のレプリケーションは、当初非同期レプリケーション用に構成されていたが、代わりに同期レプリケーションを要求される場合。 | ミラーの拡張を解除して再度拡張し、Replication Type を要求されたら「synchronous」を選択してください。 |
ターゲットが前のソースを待機中で、同期していない。 | 前のソースをクラスターに接続します。前のソースがタイムリーにクラスターに再参加できない場合は、現在のミラーソースで $LKROOT/bin/mirror_action <tag> fullresync <source> <target> コマンドを実行し、ターゲットを完全再同期で再接続してください。 |
このトピックへフィードバック