説明
Amazon Linux 2023環境において/var/log/lifekeeper.logに以下のメッセージが出力される。

internal error: j_async: bad nzombie (0)

原因:
ユーザーごとの最大プロセス数(nproc)が unlimitedに設定されているためです。

対処:
本メッセージを出力させないようにするには、ユーザーごとのプロセス上限値を unlimited ではなく、正の数値を指定してください。
具体的には、設定ファイル /etc/default/LifeKeeper 内に、ulimit -u 10000 のように記述することで、適切な上限値が適用されエラーが解消されます。
Amazon Linux 2023上のRecovery Kit for EC2は、ネットワークのリンクダウンが発生した場合、回復を実行できません。

課題:
ネットワークリンクダウンが発生すると、Recovery Kit for EC2 のリカバリ処理が失敗します。リンクダウンを検出すると、Recovery Kit for EC2 は nmcli コマンドを使用してリカバリを試みます。しかし、Amazon Linux 2023 には nmcli ユーティリティが含まれていないため、リカバリ処理は失敗します。

対処:
/etc/default/LifeKeeper の設定値を以下に設定すれば、
ネットワークインターフェースのリンク状態のチェックを無効化できます。IP_NOLINKCHECK=1
EC2インスタンスに十分な権限が付与されているにも関わらず、EC2リソース(ルートテーブルシナリオ)作成時に権限の不足の警告が表示され、リソースの作成に失敗する。

原因:
以下の2つの原因が関係して本現象が発生します。
  1. EC2リソース(ルートテーブルシナリオ)作成時、ロールチェックで権限が付与されていないと判断されることがあります。これは権限が付与されていないRouteTableに対してLifeKeeperがロールチェックをしていることが原因です。
  2. v9.6.0で送信元/送信先チェックを無効化する処理が追加されました。本機能のデフォルトの挙動として、権限が不足している場合はEC2リソース(ルートテーブルシナリオ)の作成に失敗するようになりました。
対処:
/etc/default/LifeKeeperEC2_NO_SRC_DEST_CHECK=0 を設定することで、権限の不足による警告が表示されてもリソースの作成自体は成功するように変更できます。(これはv9.5.1以前と同じ挙動となります。)

フィードバック

お役に立ちましたか?

はい いいえ
お役に立ちましたか
理由をお聞かせください
フィードバックありがとうございました

このトピックへフィードバック

送信