症状
考えられる要因
VMDKリソースをスイッチオーバーすると、元アクティブノードのシステムが停止する。 原因 : VMDKリソースのquickCheckデーモンのPIDファイル /tmp/LK-vmdk-* が削除されるとrecover処理により新しいquickCheckデーモンが起動します。その際古いデーモンは停止されません。リソースのremove時にはPIDファイルに対応するquickCheckデーモンのみを停止するため、古いデーモンがVMDKのデタッチを検知し、システムを停止させます。

対応 : PIDファイルを削除しないでください。
また、一般的に /tmp 以下にある一定期間更新されていないファイルは自動的に削除されます。これはtmpwatchのcron実行やsystemd-tmpfilesなどによって実現されます。PIDファイルが削除されないように各仕組みに応じた除外設定を行って下さい。

設定例: systemd-tmpfiles の場合
echo "x /tmp/LK-vmdk-*" > /etc/tmpfiles.d/lifekeeper.conf

quickCheckデーモンが複数起動しているかどうかの確認方法と起動していた場合の対応方法
for tag in `ins_list -f, -a scsi -r vmdk | cut -d, -f4`; do echo -n "$tag: "; pgrep -f "vmdk_quickCheck.ps1.*$tag$" | wc -l; done
を実行して結果が “<vmdkタグ名>: 1” 以外の場合、
pkill -INT -f "^/opt/LifeKeeper/bin/pwsh /opt/LifeKeeper/lkadm/subsys/scsi/vmdk/bin/vmdk_quickCheck.ps1"
pkill lkcheck
を実行してください。
リソース作成時にマウントポイントが選択肢にでない。 以下の要因が考えられます。

  • PowerShell / PowerCLIがインストールされていない

  • ESXiホストが登録されていない

  • disk.enableUUIDパラメータが設定されていない

  • 仮想ハードディスクが共有されていないデータストア上にある

  • SCSIコントローラの共有設定が「仮想」もしくは「物理」になっている

/var/log/lifekeeper.logに詳細なエラーが記録されているので、内容を確認して設定を見直して下さい。
LifeKeeperを停止するとシステムが停止する サービスの停止を伴わないLifeKeeperの停止を実施した場合、システム全体が停止する可能性があります。詳細については こちら をご確認ください。

フィードバック

お役に立ちましたか?

はい いいえ
お役に立ちましたか
理由をお聞かせください
フィードバックありがとうございました

このトピックへフィードバック

送信