2.12. OpenStack Platform 10 オーバークラウドの検証
Red Hat OpenStack Platform 10 のオーバークラウドをアップグレードする前に機能を確認するステップを以下に示します。
手順
アンダークラウドのアクセス情報を読み込みます。
$ source ~/stackrc
ベアメタルノードのステータスを確認します。
$ openstack baremetal node list
全ノードの電源状態が有効で (
on
)、かつメンテナーンスモードがfalse
である必要があります。エラーが発生している Systemd サービスがあるかどうかを確認します。
$ for NODE in $(openstack server list -f value -c Networks | cut -d= -f2); do echo "=== $NODE ===" ; ssh heat-admin@$NODE "sudo systemctl list-units --state=failed 'openstack*' 'neutron*' 'httpd' 'docker' 'ceph*'" ; done
全サービスへの HAProxy 接続をチェックします。コントロールプレーンの仮想 IP アドレスと
haproxy.stats
サービスの認証情報を取得します。$ NODE=$(openstack server list --name controller-0 -f value -c Networks | cut -d= -f2); ssh heat-admin@$NODE sudo 'grep "listen haproxy.stats" -A 6 /etc/haproxy/haproxy.cfg'
前の手順で取得した接続および認証情報を使用して、RHOSP サービスの接続ステータスを確認します。
SSL が有効になっていない場合は、次の cURL リクエストでこれらの詳細を使用します。
$ curl -s -u admin:<PASSWORD> "http://<IP ADDRESS>:1993/;csv" | egrep -vi "(frontend|backend)" | awk -F',' '{ print $1" "$2" "$18 }'
SSL が有効になっている場合は、次の cURL リクエストでこれらの詳細を使用します。
curl -s -u admin:<PASSWORD> "https://<HOSTNAME>:1993/;csv" | egrep -vi "(frontend|backend)" | awk -F',' '{ print $1" "$2" "$18 }'
<PASSWORD>
および<IP ADDRESS>
または<HOSTNAME>
の値は、haproxy.stats
サービスからのそれぞれの情報に置き換えます。その結果表示される一覧には、各ノード上の OpenStack Platform サービスとそれらの接続ステータスが表示されます。オーバークラウドデータベースのレプリケーションの正常性を確認します。
$ for NODE in $(openstack server list --name controller -f value -c Networks | cut -d= -f2); do echo "=== $NODE ===" ; ssh heat-admin@$NODE "sudo clustercheck" ; done
RabbitMQ クラスターの正常性を確認します。
$ for NODE in $(openstack server list --name controller -f value -c Networks | cut -d= -f2); do echo "=== $NODE ===" ; ssh heat-admin@$NODE "sudo rabbitmqctl node_health_check" ; done
Pacemaker リソースの正常性を確認します。
$ NODE=$(openstack server list --name controller-0 -f value -c Networks | cut -d= -f2); ssh heat-admin@$NODE "sudo pcs status"
以下の点を確認します。
-
全クラスターノードが
online
であること -
いずれのクラスターノード上でも
stopped
のリソースがないこと -
pacemaker で
failed
のアクションがないこと
-
全クラスターノードが
各オーバークラウドノードでディスク領域を確認します。
$ for NODE in $(openstack server list -f value -c Networks | cut -d= -f2); do echo "=== $NODE ===" ; ssh heat-admin@$NODE "sudo df -h --output=source,fstype,avail -x overlay -x tmpfs -x devtmpfs" ; done
オーバークラウドの Ceph Storage クラスターの正常性を確認します。以下のコマンドを使用すると、コントローラーノード上で
ceph
ツールが実行されて、クラスターをチェックします。$ NODE=$(openstack server list --name controller-0 -f value -c Networks | cut -d= -f2); ssh heat-admin@$NODE "sudo ceph -s"
Ceph Storage OSD に空き領域があるかどうかを確認します。以下のコマンドを使用すると、コントローラーノード上で
ceph
ツールが実行され、空き領域をチェックします。$ NODE=$(openstack server list --name controller-0 -f value -c Networks | cut -d= -f2); ssh heat-admin@$NODE "sudo ceph df"
重要各 Ceph オブジェクトストレージデーモン (OSD) の配置グループ (PG) の数は、デフォルトでは 250 を超えることができません。OSD ごとの PG 数が上限を超える Ceph ノードをアップグレードすると、警告状態になりアップグレードプロセスが失敗する可能性があります。アップグレードプロセスを開始する前に、OSD ごとの PG 数を増やすことができます。この問題の診断およびトラブルシューティングに関する詳細は、アーティクル OpenStack FFU from 10 to 13 times out when Ceph allocated in one or more OSDs more than 250 PGs を参照してください。
オーバークラウドノードでクロックが同期されていることを確認します。
$ for NODE in $(openstack server list -f value -c Networks | cut -d= -f2); do echo "=== $NODE ===" ; ssh heat-admin@$NODE "sudo ntpstat" ; done
オーバークラウドのアクセス情報を読み込みます。
$ source ~/overcloudrc
オーバークラウドのネットワークサービスを確認します。
$ openstack network agent list
全エージェントが
Alive
で、それらの状態がUP
である必要があります。オーバークラウドの Compute サービスを確認します。
$ openstack compute service list
全エージェントのステータスが
enabled
で、状態がup
である必要があります。オーバークラウドのボリュームサービスを確認します。
$ openstack volume service list
全エージェントのステータスが
enabled
で、状態がup
である必要があります。
関連情報
- How can I verify my OpenStack environment is deployed with Red Hat recommended configurations? の記事を参照してください。この記事には、Red Hat OpenStack Platform 環境をチェックして、Red Hat の推奨値に合わせて設定を調整する方法が記載されています。
- Database Size Management for Red Hat Enterprise Linux OpenStack Platform の記事を参照して、オーバークラウド上の OpenStack Platform サービスの未使用のデータベースレコードをチェックしてクリーニングします。