4.4. HCI コンピュートノードのリブート
以下の手順では、コンピュートハイパーコンバージドインフラストラクチャー (HCI) ノードをリブートします。
手順
Ceph MON またはコントローラーノードにログインして、Ceph MON コンテナーの名前を特定します。
$ sudo podman ps | grep -i ceph | grep -i mon 45fe68d340e5 docker-registry.upshift.redhat.com/ceph/rhceph-4.0-rhel8:latest
CEPH_MON_CONTAINER
変数をコンテナーの名前に設定します。$ CEPH_MON_CONTAINER=ceph-mon-controller-0
CEPH_MON_CONTAINER
変数を使用して Ceph コマンドを実行できることを確認します。$ sudo podman exec $CEPH_MON_CONTAINER ceph -s
Ceph MON またはコントローラーノードから、Ceph Storage クラスターのリバランスを一時的に無効にします。
$ sudo podman exec $CEPH_MON_CONTAINER ceph osd set noout $ sudo podman exec $CEPH_MON_CONTAINER ceph osd set norebalance
-
アンダークラウドに
stack
ユーザーとしてログインします。 全コンピュートノードとその UUID を一覧表示します。
$ source ~/stackrc (undercloud) $ openstack server list --name compute
リブートするコンピュートノードの UUID を特定します。
アンダークラウドから、コンピュートノードを選択し、そのノードを無効にします。
$ source ~/overcloudrc (overcloud) $ openstack compute service list (overcloud) $ openstack compute service set [hostname] nova-compute --disable
コンピュートノード上の全インスタンスを一覧表示します。
(overcloud) $ openstack server list --host [hostname] --all-projects
以下のコマンドの 1 つを使用して、インスタンスを移行します。
選択した特定のホストにインスタンスを移行する。
(overcloud) $ openstack server migrate [instance-id] --live [target-host]--wait
nova-scheduler
により対象のホストが自動的に選択されるようにする。(overcloud) $ nova live-migration [instance-id]
一度にすべてのインスタンスのライブマイグレーションを行う。
$ nova host-evacuate-live [hostname]
注記nova
コマンドで非推奨の警告が表示される可能性がありますが、無視して問題ありません。
- 移行が完了するまで待ちます。
移行が正常に完了したことを確認します。
(overcloud) $ openstack server list --host [hostname] --all-projects
- 選択したコンピュートノードのインスタンスがなくなるまで、移行を続けます。
Ceph MON またはコントローラーノードにログインし、クラスターのステータスを確認します。
$ sudo podman exec $CEPH_MON_CONTAINER ceph -s
pgmap
により、すべてのpgs
が正常な状態 (active+clean
) として報告されることを確認します。コンピュート HCI ノードをリブートします。
$ sudo reboot
- ノードがブートするまで待ちます。
コンピュートノードを再度有効化します。
$ source ~/overcloudrc (overcloud) $ openstack compute service set [hostname] nova-compute --enable
コンピュートノードが有効化されていることを確認します。
(overcloud) $ openstack compute service list
- ノードからログアウトして、次のノードをリブートし、ステータスを確認します。全 Ceph Storage ノードがリブートされるまで、このプロセスを繰り返します。
完了したら、Ceph MON またはコントローラーノードにログインして、クラスターのリバランスを再度有効にします。
$ sudo podman exec $CEPH_MON_CONTAINER ceph osd unset noout $ sudo podman exec $CEPH_MON_CONTAINER ceph osd unset norebalance
最終のステータスチェックを実行して、クラスターが
HEALTH_OK
を報告していることを確認します。$ sudo podman exec $CEPH_MON_CONTAINER ceph status