ノード上ですべてのリソースが Out of service の場合、Standbyノードと判断して Node監視のスクリプトを呼び出します。Node監視のスクリプトが CPU や Memory の使用率の監視を行い、ノードが正常に切り替えが出来ない可能性が高い状態にあると判断すると、異常ありと判断され、予め設定されたメール通知機能、またはSNMPのイベント転送機能を通じて、検知した内容を通知します。この監視処理は、通常のLifeKeeperの監視実行間隔( LKCHECKINTERVAL の設定値)と同じ間隔で実行されます。
監視可能な項目
Node監視で監視できる項目は以下です。
リソース名 | 監視内容 |
---|---|
CPU使用率 | /proc/stat ファイルから、監視実行時のCPU使用率を確認します。 |
Memory使用率 | /proc/meminfo ファイルから、監視実行時のMemory使用率を確認します。 |
Node監視の設定
/etc/default/LifeKeeper 設定ファイルで SNHC_CPUCHECK や SNHC_MEMCHECK の設定を有効に設定してください。また、他に以下の設定があります。詳細は「 Standby Node Health Check パラメータ一覧 」を参照してください。
- SNHC_CPUCHECK_THRESHOLD
- SNHC_CPUCHECK_TIME
- SNHC_MEMCHECK_THRESHOLD
- SNHC_MEMCHECK_TIME
このトピックへフィードバック