Out of service(ステータスがOSU) の各リソースについて、lkcheck が定期的にそのリソースタイプの OSUquickCheck スクリプトを呼び出します。OSUquickCheck スクリプトがリソースのクイック健全性チェックを実行し、リソースが正常に切り替えが出来ない可能性が高い状態にあると判断すると、該当リソースのステータスを OSF に変更し、異常ありと判断され、予め設定されたメール通知機能、またはSNMPのイベント転送機能を通じて、検知した内容を通知します。この監視処理は、通常の LifeKeeper の監視実行間隔(LKCHECKINTERVALの設定値)と同じ間隔で実行されます。
監視可能なリソース
現在は、以下の表に記載されているリソースがOSUリソース監視の対象となっています。
リソース名 | 監視内容 |
---|---|
IPリソース | IPリソースの対象となるNICリンクの状態を確認します(IP_NOLINKCHECK=1の場合は確認しません)。 pingが可能かつping listが設定されている場合は、登録されているアドレスへの到達性を確認します。実IPリソースは監視対象外です。 |
DMMP Diskリソース | multipathコマンドを用いて対象のDiskへのパスを確認します。 |
OSUリソース監視の設定
/etc/default/LifeKeeper 設定ファイルで SNHC_IPCHECK や SNHC_DISKCHECK の設定を有効に設定してください。また、他に以下の設定があります。詳細は「 Standby Node Health Check パラメータ一覧 」を参照してください。
- SNHC_IPCHECK_SLEEPTIME
障害からの復帰
OSUリソース監視で異常が検知された場合、該当リソースのステータスがOSF(Out of service かつ障害あり)に変更されます。ステータスが変更されると、該当のリソースに対してOSUリソース監視は実行されなくなります。障害検知の通知の内容を確認して障害を取り除いた後、該当リソースのステータスをOSUに復帰させる必要があります。
以下のコマンドを実行してステータスをOSFからOSUに復帰できます。
/opt/LifeKeeper/lkadm/bin/retstate <resource tag>
このトピックへフィードバック