症状 考えられる要因
VMDKリソースをスイッチオーバーすると、元アクティブノードのシステムが停止する。 原因 : VMDKリソースのquickCheckデーモンのPIDファイル /tmp/LK-vmdk-* が削除されるとrecover処理により新しいquickCheckデーモンが起動します。その際古いデーモンは停止されません。リソースのremove時にはPIDファイルに対応するquickCheckデーモンのみを停止するため、古いデーモンがVMDKのデタッチを検知し、システムを停止させます。

対応 : PIDファイルを削除しないでください。
また、一般的に /tmp 以下にある一定期間更新されていないファイルは自動的に削除されます。これはtmpwatchのcron実行やsystemd-tmpfilesなどによって実現されます。PIDファイルが削除されないように各仕組みに応じた除外設定を行って下さい。

設定例: systemd-tmpfiles の場合
echo "x /tmp/LK-vmdk-*" > /etc/tmpfiles.d/lifekeeper.conf

quickCheckデーモンが複数起動しているかどうかの確認方法と起動していた場合の対応方法
for tag in `ins_list -f, -a scsi -r vmdk | cut -d, -f4`; do echo -n "$tag: "; pgrep -f "vmdk_quickCheck.ps1.*$tag$" | wc -l; done
を実行して結果が “<vmdkタグ名>: 1” 以外の場合、
pkill -INT -f "^/opt/LifeKeeper/bin/pwsh /opt/LifeKeeper/lkadm/subsys/scsi/vmdk/bin/vmdk_quickCheck.ps1"
pkill lkcheck
を実行してください。
ESXiホストの登録に失敗する。 RHEL9系OSでESXiホストの登録時「No usable version of libssl was found」のエラーで失敗する場合があります。

原因 : PowerShellが依存するライブラリがシステムにインストールされていないため。

対応 : OSの提供するパッケージcompat-openssl11をインストールする。
リソース作成時にマウントポイントが選択肢にでない。 以下の要因が考えられます。
  • PowerShell / PowerCLIがインストールされていない
  • ESXiホストが登録されていない
  • disk.enableUUIDパラメータが設定されていない
  • 仮想ハードディスクが共有されていないデータストア上にある
  • SCSIコントローラの共有設定が「仮想」もしくは「物理」になっている

/var/log/lifekeeper.logに詳細なエラーが記録されているので、内容を確認して設定を見直して下さい。
VMDK リソースの In Service にかかる時間が長くなる。 原因 : In Service 時に行われる処理の中に ESXi ホスト上の稼働中の仮想マシン数に比例して時間のかかる処理が含まれているため。

対応 : 根本修正は将来のリリースで検討中です。この問題の当面の回避策としては以下をご検討ください。
  • VMDK リソースの数を減らす。
    VMDK リソース毎に当該の処理を行うため、 VMDK リソースの数に比例してかかる時間が長くなります。 1 つのリソース階層で複数のパーティションやファイルシステムが必要な場合 には、複数のVMDKリソースを使用するのではなく、単一のVMDKリソース上に複数のパーティションやファイルシステムを作成してください。
  • クラスターノードに関係しない ESXi ホストが VMDK リソースに登録されていれば、それらのホストの登録を解除する。
    ESXi ホスト情報の管理方法
  • 稼働中の仮想マシンの数を減らす。

フィードバック

お役に立ちましたか?

はい いいえ
お役に立ちましたか
理由をお聞かせください
フィードバックありがとうございました

このトピックへフィードバック

送信