LifeKeeper の機能
項目 | 説明 |
---|---|
ライセンス | LifeKeeper を使用するには、各サーバーに一意の実行時ライセンスキーが必要です。これは物理サーバーおよび仮想サーバーの両方に適用されます。ライセンスキーは、LifeKeeper Core ソフトウェア、および LifeKeeper リカバリーキットの各パッケージにそれぞれ必要です。インストールスクリプトで、サーバーの Host ID を取得して表示するラインセンスユーティリティパッケージをインストールします。ライセンスがインストールされた後、ユーティリティが、使用可能な Entitlement ID、または Host ID (Entitlement ID が使用できない場合) を返します。ホスト ID およびソフトウェアに付属のアクティベーション ID を使用して SIOS Technology Corp. の Web サイト からライセンスキーを取得してください。 |
大型クラスターのサポート | LifeKeeper は、最大 32 台のサーバーを持つ大型クラスターの設定をサポートします。ただし、LifeKeeper 以外の多くの要因が、クラスター内でサポートされるサーバーの台数に影響することがあります。この要因として、ストレージの相互接続、オペレーティングシステム、ストレージソフトウェアの制限などがあります。サポートされる最大クラスターサイズを調べるには、ベンダ固有のハードウェアとソフトウェアの設定情報を参照してください。 |
国際化とローカライズ | LifeKeeper for Linux v5.2 以降は、リソース名とタグ名でのワイド / マルチバイト文字の使用をサポートしていますが、ネイティブの言語メッセージサポートは含まれていません。Java のプロパティファイルのロケール固有バージョンを作成することにより、LifeKeeper の GUI をローカライズできますが、現在フルにローカライズされているのは英語バージョンのみです。ただし、LifeKeeper の GUI に表示される多くのメッセージは LifeKeeper Core から来ているので、GUI のローカライズは、ユーザーにとって、Core ソフトウェアがフルにローカライズされるまでの単なる部分的な解決法です。 追加情報については、制限または既知の問題 の 「言語環境の影響」 も参照してください。 |
LifeKeeper の MIB ファイル | LifeKeeper は、LifeKeeper クラスター内で発生するイベントを記述する SNMP トラップを送出するように設定できます。この機能の設定に関する詳細については、lk_configsnmp(8) のマニュアルページを参照してください。LifeKeeper のトラップを記述する MIB ファイルは、 /opt/LifeKeeper/include/LifeKeeper-MIB.txt に記載されています。 |
Watchdog | LifeKeeper は、Watchdog 機能をサポートしています。この機能は、SIOS Technology Corp. により Red Hat EL 6 + softdog 、および Red Hat EL 7 + softdog でテスト済みです。 |
STONITH | LifeKeeper は、STONITH 機能をサポートしています。この機能は、SIOS Technology Corp. により IBM x3550 x86_64 アーキテクチャ上の SLES 11、および RHEL5.5 の 64-ビットでテスト済みです。 |
XFS ファイルシステム | XFS ファイルシステムは、ファイルシステムのチェックと修正に fsck ユーティリティを使用しません。その代わりに、ログの再生をマウントに依存します。整合性の問題についての懸念がある場合は、システム管理者がファイルシステムを out of service にしてシステムをアンマウントし、xfs_check(8) と xfs_repair(8) を実行して問題を解決する必要があります。 |
IPv6 | SIOS は、ip コマンドの使用に移行し、ifconfig コマンドを使用しなくなりました (詳細については IPv6 の既知の問題 を参照)。 |
チューニング
項目 | 説明 |
---|---|
IPC セマフォと IPC 共有メモリ | LifeKeeper には、プロセス間通信 (IPC) セマフォと IPC 共有メモリが必要です。以下の Linux カーネルオプションの Red Hat のデフォルト値は、 /usr/include/linux/sem.h にあり、LifeKeeper の多数の設定をサポートするのに十分な値です。 注記: 以下は各オプションにおいてLifeKeeperに必要な最小値です。これらの値は LifeKeeper 専用であり、他のアプリケーションセマフォ要件に基づいて調整する必要がありますが、LifeKeeper の最小値を下回ってはなりません。 オプション 最小値 Red Hat 7 のデフォルト値 SEMOPM 14 32 SEMMNI 25 128 SEMMSL 20 32000 |
システムファイルテーブル | LifeKeeper がバックアップシステムに正常にフェイルオーバーするためには、システムリソースが使用可能である必要があります。例えば、システムファイルテーブルがフルの場合、LifeKeeper が新しいプロセスを開始してリカバリーを実行することができない可能性があります。エンタプライズパッチを持つカーネル (LifeKeeper がサポートするものを含む) では、file-max、つまりシステムで開いているファイルの最大数は、デフォルトでシステムメモリサイズの 1/10 に設定されます。これは、LifeKeeper の多数の設定をサポートするのに十分な値です。file-max 値をデフォルト値よりも低く設定すると、予期しない LifeKeeper の障害が発生することがあります。 file-max 値は、以下のコマンドで取得できます。 このコマンドは、3 つの値を返します。1 番目の値はファイルテーブルのエントリのこれまでの最大値 (システムがこれまでに検出した最大値)、2 番目の値は現在のファイルテーブルのエントリ数、3 番目の値は file-max 値です。 file-max を調整するには、/etc/sysctl.conf の「fs,file-max」値を追加 (または変更) し (フォーマットについては sysctl.conf(5) を参照)、 次にこのファイルを実行して、システムを更新します。/etc/sysctl.conf の値は、再起動後も保持されます。 |
LifeKeeper の動作
項目 | 説明 |
---|---|
カーネルデバッガ (kdb) | LifeKeeper が保護するサーバーでカーネルデバッガ ( kdb ) を使用する前に、そのサーバーで LifeKeeper をシャットダウンするか、LifeKeeper が保護するリソースをバックアップサーバーにスイッチオーバーする必要があります。LifeKeeper の SCSI 予約デーモン ( lkscsid ) を有効にした状態で (デフォルトで有効)、 kdb を使用すると、予期しないパニックが発生することがあります。 |
ロックしている共有デバイスでのシステムパニック | LifeKeeper はロックを使用して、共有 SCSI バス上にある他のサーバーがアクセスしないように共有データを保護します。他のサーバーがデバイスをロックしたことにより LifeKeeper がデバイスにアクセスできない場合、致命的なエラーが発生し、即座に対処する必要があります。対処しない場合、データが破損するおそれがあります。この条件が検出された場合、LifeKeeper はシステムにパニックを発生させる機能を有効にします。 共有デバイスが予約された状態で、LifeKeeper が「lkcli stop -f」の様にリソースを停止させずに LifeKeeper のデーモンのみを停止した場合、他のサーバーがリソースを復旧するときに LifeKeeper のロックメカニズムによりカーネルのパニックがトリガされることがあります。この方法で LifeKeeper を停止する前に、リソースをすべて out-of-service にする必要があります。 |
nolock オプション | NFS 領域でロックを使用するアプリケーションを使用し、LifeKeeper の推奨するマウントオプションを使用する場合は、nolock を追加する必要があります。 rw,nolock,bg,hard,tcp,nfsvers=3,timeo=600,rsize=32768,wsize=32768,actimeo=0 |
Out-of-Service 階層の復旧 | LifeKeeper サーバーの障害発生後のリカバリーの一部として、障害が発生したサーバーに設定されているリソース階層のうち、障害発生時にいずれかのサーバーで in-service ではないものは、その時点で優先順位が最高の alive のサーバーで復旧されます。これは、障害が発生したサーバー、復旧中のサーバー、クラスター内の他のサーバーを含め、 out of service の階層が最後にどこで in service だったかには無関係です。 |
Linux ファイアーウォールとの共存 | LifeKeeper はコミュニケーションパス、GUI、IP、およびデータレプリケーションに特定のポートを使用することに注意してください。Linux のファイアーウォール機能を使用する場合、LifeKeeper が使用している特定のポートを開放する必要があります。詳細については、ファイアーウォールを使用した状態での LifeKeeper の実行 を参照してください。 ファイアーウォールを無効・変更するには、OS ディストリビューションのドキュメントを参照してください。 |
Linuxセキュリティソフトとの共存 | SELinuxが有効になっている場合 (enforcingモードまたはpermissive モード)、LifeKeeper では“mmap_low_allowed” が“on”である必要があります。
|
Suid マウントオプション | suid マウントオプションは、 root としてマウントするときのデフォルトであり、マウントコマンドにより /etc/mtab に書き込まれることはありません。LifeKeeper 環境では、suid マウントオプションは不要です。 |
サーバーの設定
項目 | 説明 |
---|---|
BIOS のアップデート | 使用可能な最新の BIOS を常にすべての LifeKeeper サーバーにインストールする必要があります。 |
LifeKeeper 8.2.0 以降の GUI 要件
LifeKeeper GUI クライアントでユーザーを正常に認証するには、64 ビットバージョンの PAM 関連のパッケージがすべて必要です。
[Confirm Failover] と [Block Resource Failover] の設定
以下の説明、例、および考慮事項をよく読んで理解してから、お使いの LifeKeeper 環境で [Confirm Failover] または [Block Resource Failover] を設定してください。これらの設定は、コマンドライン、または LifeKeeper の GUI の [Properties] パネルから使用できます。
Confirm Failover On:
定義 – システム A から システム B へのフェイルオーバーの手動確認を有効にします ( システム A はプロパティが [Properties] パネル に表示されるサーバーで、 システム B はチェックボックスの左にあるシステム)。あるシステムでこのオプションをオンに設定した場合、障害発生が検出されたシステムについて LifeKeeper がフェイルオーバーリカバリーを実行するには、システム管理者による手動確認が必要になります。
フェイルオーバーを確認するには、lk_confirmso コマンドを使用してください。デフォルトでは、このコマンドを実行するまで管理者には 10 分の猶予時間があります。この時間は、 /etc/default/LifeKeeper の CONFIRMSOTO 設定で変更できます。管理者が 10 分以内に lk_confirmso コマンドを実行しない場合、フェイルオーバーは続行されるか、ブロックされます。デフォルトでは、フェイルオーバーが続行されます。この動作は、 /etc/default/LifeKeeper の COMFIRMSODEF 設定で変更できます。
例 : 自動フェイルオーバーをすべてブロックする場合は、 [Properties] パネルの [Confirm Failover On] オプションを設定し、さらに CONFIRMSODEF を 1 (フェイルオーバーをブロック)、 CONFIRMSOTO を 0 (フェイルオーバー動作が決定されるまで待機しない) に設定してください。
この設定を選択するタイミング:
この設定は、設定に冗長ハートビートコミュニケーションパスを含まない多くのディザスタリカバリー、その他の WAN 設定で使用されます。
あるサーバーで [Properties] ページを開き、 [Confirm Failover] フラグ をオンに設定するサーバーを選択してください。
Block Resource Failover On:
定義 - デフォルトでは、リソースのすべての障害について復旧イベントが発生し、ローカルシステムの障害リソースの復旧が試行されます。ローカルリカバリーが失敗した場合、または有効になっていない場合は、リソースが定義されている、優先順位が次に最も高いシステムに、LifeKeeper がローカル履歴を転送します。ただし、宛先として指定したシステムでこの設定を選択している場合、リソース障害に起因するリソースの転送はすべてブロックされます。
この設定が有効の場合、以下のメッセージがログに記録されます。
Local recovery failure, failover blocked, MANUAL INTERVENTION REQUIRED
このトピックへフィードバック