4.2. RHBA-2023:0271 - Red Hat OpenStack Platform 17.0.1 のバグ修正と機能強化のアドバイザリー
openstack-aodh コンポーネントに対する変更:
- この更新の前は、Alarming サービス (aodh) は非推奨の gnocchi API を使用してメトリクスを集計していました。これにより、gnocchi の結果で CPU 使用率の測定値が正しくありませんでした。今回の更新により、gnocchi で動的集計が使用されるようになり、既存のメトリクスの再集計を行う機能と、必要に応じてメトリクスを作成および変換する機能がサポートされたため、この問題は解決されます。gnocchi の CPU 使用率は正しく計算されます。(BZ#2098594)
openstack-designate コンポーネントに対する変更:
- この更新の前は、TLS-everywhere が有効になっていると、Red Hat OpenStack Platform (RHOSP) DNS サービス (designate) が中心的プロセスを開始できませんでした。これは、TLS 経由で Redis に接続できないことが原因でした。今回の RHOSP 17.0.1 の更新により、この問題は解決されました。(BZ#2121634)
openstack-ironic-python-agent コンポーネントに対する変更:
- この更新の前は、ironic-python-agent が RHEL 8.6 UEFI ブートローダーヒントファイルを認識しなかったため、ironic-python-agent を使用すると、RHEL 8.6 イメージを UEFI モードでデプロイできませんでした。今回の更新により、RHEL 8.6 を UEFI モードでデプロイできるようになりました。(BZ#2098594)
openstack-nova コンポーネントに対する変更:
- この更新の前は、ベースとなる RHEL の問題により、インスタンスの UEFI ブートに関する既知の問題が発生していました。今回の更新により、ベースとなる RHEL の問題が修正され、インスタンスの UEFI セキュアブート機能が利用できるようになりました。(BZ#2098594)
openstack-octavia コンポーネントに対する変更:
- この更新の前は、Octavia で競合状態が発生し、特定の条件下で OVN プロバイダーのロードバランサーが PENDING DELETE で停止することがありました。これにより、ロードバランサーがイミュータブルになり、更新できなくなりました。今回の更新で、競合状態が修正され、問題が解決されました。(BZ#2098594)
openstack-tripleo-heat-templates コンポーネントに対する変更:
- この更新の前は、Podman ログコンテンツが利用できないため、ヘルスチェックステータススクリプトの実行が失敗していました。今回の更新により、ヘルスチェックステータススクリプトが更新され、Podman ログの代わりに Podman ソケットが使用されるようになるため、この問題が解決されます。その結果、Service Telemetry Framework の sensubility によって提供される API ヘルスチェックが動作するようになりました。(BZ#2091076)
RHOSP 17.0 には現在、Free Range Router (FRR) コンテナーが存在するホストが再起動された後、コンテナーが起動しないという既知の問題があります。この問題は、BGP 設定に欠落しているファイルが原因で発生します。回避策: ファイル
/etc/tmpfiles.d/run-frr.conf
を作成し、次の行を追加します。d /run/frr 0750 root root - -
この変更により、
tmpfiles
はリブートのたびに/run/frr
を再作成し、FRR コンテナーを起動できるようになります。(BZ#2098594)
python-os-vif コンポーネントに対する変更:
-
この更新の前は、
ovsdb
接続のタイムアウトにより、nova-compute
エージェントが応答しなくなりました。今回の更新により、問題が修正されました。(BZ#2085583)
python-ovn-octavia-provider コンポーネントに対する変更:
-
この更新の前は、メンバーのサブネットがロードバランサーの仮想 IP のサブネットと異なる場合に、サブネット情報を持たないメンバーを追加すると、ovn-octavia プロバイダーが
subnet_id
に仮想 IP サブネットを誤って使用していました。その結果、エラーは発生しないものの、メンバーへの接続ができない問題が発生していました。今回の更新で、サブネット情報がない場合に、仮想 IP が属するのと同じ CIDR にメンバーの実際の IP が属することが確認されるようになったため、この問題は解決されます。2 つの IP アドレスが一致しない場合、アクションは拒否され、subnet_id
が要求されます。(BZ#2122926) この更新の前は、2 つのサブネット (IPv4 と IPv6) を持つ LS (neutron ネットワーク) に ovn-lb (仮想 IP とメンバー) を作成し、この LS を LR に接続した場合、LR から LS を削除すると、ovn-lb が LS から削除され、結果として OVN SB DB からも削除されました。これは、ovn-lb はどのデータパスにも関連付けられていないためです。LS を LR (ルーターへのネットワークとサブネット) に再度追加すると、ovn-lb は OVN レベルで LR/LS に適切に関連付けられず、接続がなくなりました。
今回の更新で、IP バージョンが確認されるようになったため、他のサブネットに属するルーターポートが考慮されなくなり、ovn-lb が LS から削除されなくなりました。これにより、サブネットがルーターから削除されたときに、ovn-lb が適切に接続されます。これにより問題が解決します。(BZ#2098594)
tripleo-ansible コンポーネントに対する変更:
現在、調整されたカーネル設定が初期プロビジョニング後に適用されないという既知の問題があります。
回避策: 次のカスタム Playbook を使用して、調整されたカーネルコマンドライン引数が適用されるようにすることができます。以下の Playbook を
/usr/share/ansible/tripleo-playbooks/cli-overcloud-node-reset-blscfg.yaml
としてアンダークラウドノードに保存します。- name: Reset BLSCFG of compute node(s) meant for NFV deployments hosts: allovercloud any_errors_fatal: true gather_facts: true pre_tasks: - name: Wait for provisioned nodes to boot wait_for_connection: timeout: 600 delay: 10 tasks: - name: Reset BLSCFG flag in grub file, if it is enabled become: true lineinfile: path: /etc/default/grub line: "GRUB_ENABLE_BLSCFG=false" regexp: "^GRUB_ENABLE_BLSCFG=.*" insertafter: '^GRUB_DISABLE_RECOVERY.*'
ノード定義ファイル
overcloud-baremetal-deploy.yaml
でロールを設定して、kernelargs
を設定する Playbook の前にcli-overcloud-node-reset-blscfg.yaml Playbook
を実行します。- name: ComputeOvsDpdkSriov count: 2 hostname_format: computeovsdpdksriov-%index% defaults: networks: - network: internal_api subnet: internal_api_subnet - network: tenant subnet: tenant_subnet - network: storage subnet: storage_subnet network_config: template: /home/stack/osp17_ref/nic-configs/computeovsdpdksriov.j2 config_drive: cloud_config: ssh_pwauth: true disable_root: false chpasswd: list: |- root:12345678 expire: False ansible_playbooks: - playbook: /usr/share/ansible/tripleo-playbooks/cli-overcloud-node-reset-blscfg.yaml - playbook: /usr/share/ansible/tripleo-playbooks/cli-overcloud-node-kernelargs.yaml extra_vars: reboot_wait_timeout: 600 kernel_args: 'default_hugepagesz=1GB hugepagesz=1G hugepages=32 iommu=pt intel_iommu=on isolcpus=1-11,13-23' tuned_profile: 'cpu-partitioning' tuned_isolated_cores: '1-11,13-23' - playbook: /usr/share/ansible/tripleo-playbooks/cli-overcloud-openvswitch-dpdk.yaml extra_vars: memory_channels: '4' lcore: '0,12' pmd: '1,13,2,14,3,15' socket_mem: '4096' disable_emc: false enable_tso: false revalidator: '' handler: '' pmd_auto_lb: false pmd_load_threshold: '' pmd_improvement_threshold: '' pmd_rebal_interval: '' nova_postcopy: true
(BZ#2098594)
-
この更新の前は、ベアメタルプロビジョニング定義の
network_config
スキーマでnum_dpdk_interface_rx_queues
パラメーターを設定できなかったため、スキーマ検証エラーが発生し、ベアメタルノードのプロビジョニングプロセスがブロックされていました。今回の更新により、'num_dpdk_interface_rx_queues' パラメーターを使用してもスキーマ検証エラーが発生しなくなりました。これにより問題が解決します。(BZ#2098594)