Out of service(ステータスが OSU) の各リソースについて、lkcheck が定期的にそのリソースタイプの OSUquickCheck スクリプトを呼び出します。OSUquickCheck スクリプトがリソースのクイック健全性チェックを実行し、リソースが正常に切り替えが出来ない可能性が高い状態にあると判断すると、該当リソースのステータスを OSF に変更し、異常ありと判断され、予め設定されたメール通知機能、または SNMP のイベント転送機能を通じて、検知した内容を通知します。この監視処理は、通常の LifeKeeper の監視実行間隔(LKCHECKINTERVAL の設定値)と同じ間隔で実行されます。

 

監視可能なリソース

現在は、以下の表に記載されているリソースが OSU リソース監視の対象となっています。

リソース名 監視内容
IPリソース IPリソースの対象となる NIC リンクの状態を確認します(IP_NOLINKCHECK=1 の場合は確認しません)。
ping が可能かつ ping list が設定されている場合は、登録されているアドレスへの到達性を確認します。実 IP リソースは監視対象外です。
Disk または DMMP リソース 各リソースに対応したコマンドを用いて対象の Disk へのパスを確認します。
NASリソース NFSサーバーに対してNFS接続ができるかを確認します。NFS接続のタイムアウト値に関しては、 設定上の考慮事項 をご参照ください。

 

OSUリソース監視の設定

/etc/default/LifeKeeper 設定ファイルで SNHC_IPCHECK や SNHC_DISKCHECK の設定を有効に設定してください。また、他に以下の設定があります。詳細は「 Standby Node Health Check パラメータ一覧 」を参照してください。

  • SNHC_IPCHECK_SLEEPTIME

 

障害からの復帰

OSU リソース監視で異常が検知された場合、該当リソースのステータスが OSF(Out of service かつ障害あり)に変更されます。ステータスが変更されると、該当のリソースに対して OSU リソース監視は実行されなくなります。障害検知の通知の内容を確認して障害を取り除いた後、該当リソースのステータスを OSU に復帰させる必要があります。
以下のコマンドを実行してステータスを OSF から OSU に復帰できます。

/opt/LifeKeeper/lkadm/bin/retstate <resource tag>

フィードバック

フィードバックありがとうございました

このトピックへフィードバック

送信