ファイルシステムの健全性の監視機能は、LifeKeeper が保護する、ファイルシステム依存のアプリケーションで障害が発生する原因となる条件を検出します。監視は、アクティブ / サービス中のリソース (つまりファイルシステム) でのみ実行されます。監視する条件は、以下の 2 つです。
- ファイルシステムがフル (またはほぼフル) の状態になる。
- ファイルシステムが不適切にマウント (またはアンマウント) された。
これら 2 つの条件のいずれかが検出されると、いくつかの動作のいずれかが実行されることがあります。
- 警告メッセージがログ記録され、システム管理者に電子メールを送信できる。
- リソースインスタンスのローカルリカバリを試行できる。
- リソースをバックアップサーバーにフェイルオーバできる。
条件の定義
フル (もしくは空き容量が少なくなっている) のファイルシステム
ディスクフルの条件は検出できますが、ローカルリカバリまたはフェイルオーバの実行で解決することはできません。管理者の操作が必要です。デフォルトでは、メッセージがログ記録されます。さらに、通知スクリプトを使用して警告メッセージを管理者あてにメール送信するなど、任意の追加処理を行うことが可能です。このスクリプトはLifeKeeperインストールディレクトリ内の "events/filesys/diskfull/notify" にあります。
ディスクフルの条件に加えて、ディスクの使用率が指定のしきい値を超えている場合、警告メッセージを LifeKeeper のログに記録できます。
ディスクフルのしきい値は以下のとおりです。
FILESYSFULLERROR=95
警告を行うしきい値は以下のとおりです。
FILESYSFULLWARN=90
デフォルト値は上記のとおりそれぞれ 90% と 95% ですが、 /etc/default/LifeKeeper ファイルの調整可能なパラメータを使用して設定できます。これら 2 つのしきい値の意味は以下のとおりです。
FILESYSFULLWARN – ファイルシステムがこの割合まで使用されると、メッセージが LifeKeeper のログに表示されます。
FILESYSFULLERROR – ファイルシステムがこの割合まで使用されると、メッセージが LifeKeeper のログ、およびシステムログに表示されます。ファイルシステムの通知スクリプトも呼び出されます。
アンマウントされた、または不適切にマウントされたファイルシステム
LifeKeeper は /etc/mtab ファイルをチェックして、LifeKeeper が保護するサービス中のファイルシステムが実際にマウントされているかどうかを調べます。さらに、 filesys のリソース情報フィールドに保存されているマウントオプションに対してマウントオプションをチェックし、階層の作成時に使用されていた元のマウントポジションと一致するかどうかを確認します。
ファイルシステムがアンマウントされているか、不適切にマウントされていることを検出した場合、ローカルリカバリが起動され、正しいマウントオプションを使用してファイルシステムの再マウントが試行されます。
再マウントに失敗した場合、条件を解消するためにフェイルオーバが試行されます。以下のリストに、フェイルオーバに進行する場合がある再マウントの障害の一般的な原因を示します。
- ファイルシステムが破損している (fsck の障害)
- マウントポイントディレクトリの作成失敗
- マウントポイントがビジー
- マウントの失敗
- LifeKeeper の内部エラー
- OS のアップグレード後に新しいマウントオプションを追加
アンマウントの時間を増やすか、強制アンマウントが完了するまでの時間を減らす
特定の調整可能な値は、アンマウントにかかる時間を増やしたり、強制アンマウントが完了するまでの時間を減らしたりします。 このタイマーに寄与する3つの調整可能なパラメータがあります。
FS_UMOUNT_RETRIES (デフォルト値1)
FS_KERNEL_RETRIES (デフォルト値60). (この値を調整することを推奨します)
FS_UMOUNT_TIMEOUT (デフォルト値30)
Forceumount スクリプトの最大実行時間は、FS_KERNEL_RETRIES 調整パラメーターを操作することで短縮できます。 値を1下げる毎に、スクリプトの実行時間が3秒短くなります。
FS_UMOUNT_TIMEOUT (デフォルト値 30) は最大実行時間より大きい値を設定しないと機能しません。
最大実行時間 = ($FS_KERNEL_RETRIES * 3) + 3*($FS_UMOUNT_RETRIES + 3)
カーネルアップグレード後の新しいマウントオプション、または非推奨のマウントオプション
Linux カーネルをアップグレードすると、既存のファイルシステムマウントオプションの一部が新しいカーネルで非推奨になったり、新しいカーネルで、新しいデフォルトマウントオプションを既存のマウントに追加する可能性があります。例えば、「nobarrier」マウントオプションは RedHat Enterprise Linux 8 で廃止され、一部のカーネル バージョンでは「logbufs=8」や「logbsize=32k」などの新しいデフォルトマウントオプションが追加されました。
LifeKeeper で保護されたファイルシステムリソースに、カーネルのアップグレード後に廃止されるマウントオプションが含まれている場合、廃止されたオプションは、クラスター内のすべてのサーバーで LifeKeeper リソースのマウントオプションのリストから削除する必要があります。詳細については、LifeKeeper ファイルシステムリソースのマウントオプションの変更 セクションを参照してください。
カーネルのアップグレード後に、LifeKeeper で保護された既存のマウントポイントに、カーネルによって新しいデフォルトのマウントオプションが追加された場合、クラスター内のすべてのサーバーで LifeKeeper リソースのマウントオプションのリストに、新しいオプションを追加する必要があります。詳細については、LifeKeeper ファイルシステムリソースのマウントオプションの変更 セクションを参照してください。
LifeKeeper ファイルシステムリソースのマウントオプションの変更
保護されたファイルシステムのマウント時に LifeKeeper が使用するマウントオプションを変更するには
- LifeKeeper でファイルシステムリソースを Out-of-Service にします。 これにより、保護されたファイルシステムがアンマウントされます。
- クラスター内の各サーバーのマウントオプションを更新します。
a. LifeKeeper GUI を使用する場合
i. マウントオプションを変更する各サーバーのファイルシステムリソースを右クリックし、[ Change Mount Options ] を選択します。
ii.表示されるダイアログで、LifeKeeper がファイルシステムをマウントするときに使用するオプションのカンマ区切りリストを指定して、マウントオプションを変更します。 必要なマウントオプションを入力したら、[ Set Value ] をクリックします。 [ Finish ]をクリックして確認ダイアログを終了します。
b. LifeKeeper コマンドラインインターフェイス を使用する場合
i. lkcli resource config fs --tag <tag> --mountopts “comma-separated list”
ii.このコマンドは、クラスター内の各サーバーで実行する必要があります。
- LifeKeeper でファイルシステムリソースを In-Service にします。 これにより、保護されたファイルシステムがマウントされます。
このトピックへフィードバック