再起動後に帰ってこない
Ubuntuを再起動したら、終了プロセスでエラーが起きて、シャットダウンに失敗する。
「へ?何言ってんの?」思うかもしれないが、これを見てほしい
上記のようにUSB-HDDの自動アンマウントに失敗し、シャットダウンが失敗し、フリーズする。
そしてリモートから制御不能なる。
再起動なのに、リモート制御不能になる。
SSHもシリアルコンソールも使えない。なぜならOSはすべてシャットダウンをして最後のマウント解除でコケるからだ。 どうしようもない。
ちょっとパターンが違うエラーも出た。 一見するとext4 のエラーに見えるが、btrfs に作ってるlxd のext4 のjoural 落ちてる。
末尾だけみるとbtrfs だが、追いかけてみると、swapがエラーだった。
原因
エラー表記から btrfs や lvm かと思いきや、swap が壊れていた。
swapon / swapoff で見てたら、swapがエラーになっていた。
swapを作り直した。最近はメモリ潤沢だしswap無効も良いかも。
sudo mksoff /dev/mapper/vg-swap sudo mkswap -L swap00 /dev/mapper/vg-swap sudo mkson /dev/mapper/vg-swap
btrfs のエラーが頻発するので scrubかけまくった
sudo btrfs check /dev/mapper/vg-btrfs sudo mount /dev/mapper/vg-btrfs /mnt sudo btrfs scrub start /mnt sudo btrfs scrub status /mnt sudo umount /mnt
btrfs も一部エラーがでてたけど、swapが最終的な原因だった。
たぶん、この他にもUSBデバイスを解除するタイミングでエラーが出ているので、 USBデバイスからブートされているときに、解除に失敗してる。
USBデバイスを解除するときにマウントファイルシステムの解除に失敗していると思う。
たぶん、usb-hdd が dm-crypt で lvm でマウントしているからdmsetp 解除に失敗しているじゃないかなと思う(Ubuntu 2204で起きた)
フリーズ対策 : リモート再起動の手法を確保しておく
「再起動が途中で止まる。」などとというとんでもないエラーが、Ubuntuで起きることがわかったので、今後のことも兼ねて、リモートでもモニタリングができる方法や、リモートから電源を強制的にオンオフできる方法が必要だ。
リモートの電源ON/OFF
昔に比べて、IoT用に手軽にこの手に商品が手に入るので<逸般>家庭以外の<一般>の我々でも管理ができるようになっている。
2023-05-20現在 2個セットで2200円
HDMIキャプチャでモニタリング
2023-05-20現在 15%オフで1800円くらい
また、ユーチューバー()の増加によりHDMIキャプチャが超格安で入手可能になっててモニタを2枚用意するよりキャプチャ使うほうが手軽になってる。