ファイルシステムの健全性の監視機能は、LifeKeeper が保護する、ファイルシステム依存のアプリケーションで障害が発生する原因となる条件を検出します。監視は、アクティブ / サービス中のリソース (つまりファイルシステム) でのみ実行されます。監視する条件は、以下の 2 つです。
- ファイルシステムがフル (またはほぼフル) の状態になる。
- ファイルシステムが不適切にマウント (またはアンマウント) された。
これら 2 つの条件のいずれかが検出されると、いくつかの動作のいずれかが実行されることがあります。
- 警告メッセージがログ記録され、システム管理者に電子メールを送信できる。
- リソースインスタンスのローカルリカバリを試行できる。
- リソースをバックアップサーバにフェイルオーバできる。
条件の定義
フル (もしくは空き容量が少なくなっている) のファイルシステム
ディスクフルの条件は検出できますが、ローカルリカバリまたはフェイルオーバの実行で解決することはできません。管理者の操作が必要です。デフォルトでは、メッセージがログ記録されます。さらに、通知スクリプトを使用して警告メッセージを管理者あてにメール送信するなど、任意の追加処理を行うことが可能です。このスクリプトはLifeKeeperインストールディレクトリ内の "events/filesys/diskfull/notify" にあります。
ディスクフルの条件に加えて、ディスクの使用率が指定のしきい値を超えている場合、警告メッセージを LifeKeeper のログに記録できます。
ディスクフルのしきい値は以下のとおりです。
FILESYSFULLERROR=95
警告を行うしきい値は以下のとおりです。
FILESYSFULLWARN=90
デフォルト値は上記のとおりそれぞれ 90% と 95% ですが、 /etc/default/LifeKeeper ファイルの調整可能なパラメータを使用して設定できます。これら 2 つのしきい値の意味は以下のとおりです。
FILESYSFULLWARN – ファイルシステムがこの割合まで使用されると、メッセージが LifeKeeper のログに表示されます。
FILESYSFULLERROR – ファイルシステムがこの割合まで使用されると、メッセージが LifeKeeper のログ、およびシステムログに表示されます。ファイルシステムの通知スクリプトも呼び出されます。
アンマウントされた、または不適切にマウントされたファイルシステム
LifeKeeper は /etc/mtab ファイルをチェックして、LifeKeeper が保護するサービス中のファイルシステムが実際にマウントされているかどうかを調べます。さらに、 filesys のリソース情報フィールドに保存されているマウントオプションに対してマウントオプションをチェックし、階層の作成時に使用されていた元のマウントポジションと一致するかどうかを確認します。
ファイルシステムがアンマウントされているか、不適切にマウントされていることを検出した場合、ローカルリカバリが起動され、正しいマウントオプションを使用してファイルシステムの再マウントが試行されます。
再マウントに失敗した場合、条件を解消するためにフェイルオーバが試行されます。以下のリストに、フェイルオーバに進行する場合がある再マウントの障害の一般的な原因を示します。
- ファイルシステムが破損している (fsck の障害)
- マウントポイントディレクトリの作成失敗
- マウントポイントがビジー
- マウントの失敗
- LifeKeeper の内部エラー
このトピックへフィードバック