SNMP (Simple Network Management Protocol) は、ネットワークを管理するための、デバイスに依存しないフレームワークです。ネットワーク上のデバイスは、デバイスのベンダーが提供する MIB (Management Information Base) 変数によって記述されます。ネットワーク内の各ノード上では SNMP エージェントが実行され、ネットワークマネージャノードと通信を行います。ネットワークマネージャは、エージェントに対するクエリで MIB 変数の値を取得、設定することにより、エージェントノードを監視、制御します。エージェントは、トラップと呼ばれるメッセージを非同期に生成して例外イベントの発生をマネージャにしらせることもできます。SNMP (Simple Network Management Protocol) を使用してネットワークを監視および管理するアプリケーションは多数提供されています。
LifeKeeper のイベント通知機能では、特定のイベントが起きたときに通知を受信するアプリケーションを登録することができます (sendevent(5) マニュアルページを参照)。LifeKeeper は、LifeKeeper の動作を監視するサードパーティのネットワーク管理コンソールに向けて LifeKeeper の重要なイベントに関する SNMP トラップ通知を送信するように簡単に設定できます。
SNMP トラップを受信するリモート管理コンソールは、最初にそのシステムの管理用ソフトウェアを使用して設定する必要があります。LifeKeeper は、外部の SNMP の設定機能を提供していません。リモート管理サーバは、通常、LifeKeeper クラスタの外側に配置されます (つまり LifeKeeper のノードではありません)
LifeKeeper イベントテーブル
以下の表では、LifeKeeper のイベントのリストと関連付けられているトラップ番号を示しています。オブジェクト ID (OID) は、プリフィックスとそれに続く個別のトラップ番号から、次のフォーマットで構成されます。
prefix.0.specific trap number
プリフィックスは「.1.3.6.1.4.1.7359」であり、これは MIB ツリーで iso.org.dod.internet.private.enterprises.7359 に展開されます(7359 は、SteelEye (SIOS Technology) の企業番号です。LifeKeeper を表す「1」をこれに続けます)。例えば、「LifeKeeper Startup Complete」イベントは次の OID を生成します: .1.3.6.1.4.1.7359.1.0.100 。
LifeKeeper イベント/説明 | トラップ番号 | オブジェクト ID |
---|---|---|
LifeKeeper Startup Complete LifeKeeper が起動したノードから送信されます |
100 | .1.3.6.1.4.1.7359.1.0.100 |
LifeKeeper Shutdown Initiated LifeKeeper のシャットダウンを開始したノードから送信されます |
101 | .1.3.6.1.4.1.7359.1.0.101 |
LifeKeeper Shutdown Complete LifeKeeper のシャットダウンを完了したノードから送信されます |
102 | .1.3.6.1.4.1.7359.1.0.102 |
LifeKeeper Manual Switchover Initiated on Server 手動スイッチオーバを要求したノードから送信されます |
110 | .1.3.6.1.4.1.7359.1.0.110 |
LifeKeeper Manual Switchover Complete – recovered list 手動スイッチオーバを完了したノードから送信されます |
111 | .1.3.6.1.4.1.7359.1.0.111 |
LifeKeeper Manual Switchover Complete – failed list 手動スイッチオーバに失敗したクラスタ内の各ノードから送信されます |
112 | .1.3.6.1.4.1.7359.1.0.112 |
LifeKeeper Node Failure Detected for Server クラスタ内のノードに障害が発生したときに、クラスタ内の各ノードから送信されます |
120 | .1.3.6.1.4.1.7359.1.0.120 |
LifeKeeper Node Recovery Complete for Server – recovered list 障害ノードからのリソースをリカバリしたクラスタ内の各ノードから送信されます |
121 | .1.3.6.1.4.1.7359.1.0.121 |
LifeKeeper Node Recovery Complete for Server – failed list 障害ノードからのリソースのリカバリに失敗したクラスタ内の各ノードから送信されます |
122 | .1.3.6.1.4.1.7359.1.0.122 |
LifeKeeper Resource Recovery Initiated リソースをリカバリしているノードから送信されます。リカバリが完了したか失敗したかを示す 131 または 132 トラップが必ずこれに続きます。 |
130 | .1.3.6.1.4.1.7359.1.0.130 |
LifeKeeper Resource Recovery Failed リカバリを試みたリソースを稼働できなかったときに、トラップ 130 を送信したノードから送信されます |
131* | .1.3.6.1.4.1.7359.1.0.131 |
LifeKeeper Resource Recovery Complete リソースのリカバリが完了したときに、トラップ 130 を送信したノードから送信されます |
132 | .1.3.6.1.4.1.7359.1.0.132 |
LifeKeeper Communications Path Up ノードへのコミュニケーションパスが確立されました |
140 | .1.3.6.1.4.1.7359.1.0.140 |
LifeKeeper Communications Path Down ノードへのコミュニケーションパスがダウンしました |
141 | .1.3.6.1.4.1.7359.1.0.141 |
LifeKeeper <Node monitoring> Failure Standby Node Health Check における Node監視で異常を検知したときに、異常を検知したノードから送信されます。<Node monitoring> には、検知した異常の内容が記載されます。 |
190 | .1.3.6.1.4.1.7359.1.0.190 |
LifeKeeper <OSUquickCheck> Failure Standby Node Health Check における OSUリソース監視で異常を検知したときに、異常を検知したノードから送信されます。<OSUquickCheck> には、異常が検知されたリソースのタグ名が記載されます。 |
200 | .1.3.6.1.4.1.7359.1.0.200 |
トラップ PDU に追加情報を含めるために以下の変数が使用されます。: | ||
Trap message | すべてのトラップ | .1.3.6.1.4.1.7359.1.1 |
Resource Tag | 130 | .1.3.6.1.4.1.7359.1.2 |
Resource Tag | 131 | .1.3.6.1.4.1.7359.1.2 |
Resource Tag | 132 | .1.3.6.1.4.1.7359.1.2 |
List of recovered resources | 111 | .1.3.6.1.4.1.7359.1.3 |
List of recovered resources | 121 | .1.3.6.1.4.1.7359.1.3 |
List of failed resources | 112 | .1.3.6.1.4.1.7359.1.4 |
List of failed resources | 122 | .1.3.6.1.4.1.7359.1.4 |
* 複数のバックアップサーバでリカバリに失敗すると、このトラップは複数回表示されることがあります。
このトピックへフィードバック