3.4. 既知の問題
現時点における Red Hat OpenStack Platform の既知の問題は以下のとおりです。
- BZ#1293379
現在、ネットワークの設定を変更するとインターフェースが再起動して、オーバークラウドノード上のネットワーク接続が中断されるという既知の問題があります。そのため、ネットワークの中断によって、Pacemaker コントローラークラスター内でサービスが停止し、ノードがフェンシングされてしまいます (フェンシングが設定されている場合)。その結果、tripleo-heat-templates はオーバークラウドの更新時にネットワーク設定の変更を適用しないように設計されています。ネットワークの変更を適用しないことによって、意図せずにクラスターのサービスが停止してしまうことを避けます。
現在、ネットワークの設定を変更するとインターフェースが再起動して、オーバークラウドノード上のネットワーク接続が中断されるという既知の問題があります。そのため、ネットワークの中断によって、Pacemaker コントローラークラスター内でサービスが停止し、ノードがフェンシングされてしまいます (フェンシングが設定されている場合)。その結果、tripleo-heat-templates はオーバークラウドの更新時にネットワーク設定の変更を適用しないように設計されています。ネットワークの変更を適用しないことによって、意図せずにクラスターのサービスが停止してしまうことを避けます。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1266565
現在、特定の設定ステップでは、オーバークラウドコントローラーに SSH 接続する必要があり、オーバークラウドノードに到達するには、仮想 IP を通過する必要があります。 お使いの環境で外部のロードバランサーを使用している場合には、このステップで接続は成功しない可能性が高くなります。この問題を回避するには、外部のロードバランサーがポート 22 を転送するように設定すると、仮想 IP へ正常に SSH 接続できるようになります。
現在、特定の設定ステップでは、オーバークラウドコントローラーに SSH 接続する必要があり、オーバークラウドノードに到達するには、仮想 IP を通過する必要があります。 お使いの環境で外部のロードバランサーを使用している場合には、このステップで接続は成功しない可能性が高くなります。この問題を回避するには、外部のロードバランサーがポート 22 を転送するように設定すると、仮想 IP へ正常に SSH 接続できるようになります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1312155
controller_v6.yaml テンプレートには、管理ネットワークの VLAN 用のパラメーターが 1 つ含まれています。このパラメーターは、現在のバージョンの director ではサポートされていないので、管理ネットワークに関する他のコメントとともに無視しても安全です。管理ネットワークの参照は、カスタムテンプレートにコピーする必要はありません。 このパラメーターは将来のバージョンでサポートされる予定です。
controller_v6.yaml テンプレートには、管理ネットワークの VLAN 用のパラメーターが 1 つ含まれています。このパラメーターは、現在のバージョンの director ではサポートされていないので、管理ネットワークに関する他のコメントとともに無視しても安全です。管理ネットワークの参照は、カスタムテンプレートにコピーする必要はありません。 このパラメーターは将来のバージョンでサポートされる予定です。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1239130
director はデプロイメントの前または実行中にネットワークの検証を提供しません。そのため、ネットワーク設定が適切でないデプロイメントが数時間実行されて、何も出力が表示されずに結果的に失敗する可能性があります。ネットワーク検証のスクリプトは現在開発中で、将来のリリースで実装される予定です。
director はデプロイメントの前または実行中にネットワークの検証を提供しません。そのため、ネットワーク設定が適切でないデプロイメントが数時間実行されて、何も出力が表示されずに結果的に失敗する可能性があります。ネットワーク検証のスクリプトは現在開発中で、将来のリリースで実装される予定です。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1269005
今回のリリースでは、Red Hat OpenStack Platform director は、コントローラーノード 3 台で構成される高可用性 (HA) のオーバークラウドデプロイメントのみをサポートしています。
今回のリリースでは、Red Hat OpenStack Platform director は、コントローラーノード 3 台で構成される高可用性 (HA) のオーバークラウドデプロイメントのみをサポートしています。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1274687
現在、director がパブリック API に接続して最終の設定のデプロイ後のステップを完了するのに必要となる既知の要件があります。この要件は、アンダークラウドノードにはパブリック API へのルートが 1 つあることと、そのルートが標準の OpenStack API ポートおよびポート 22 (SSH) で到達可能である必要があることです。 この要件に対応するには、デプロイ後のタスクで使用するコントローラー上の外部ネットワークにアンダークラウドが到達可能かをチェックしておいてください。このような準備をしておくことにより、アンダークラウドはデプロイ後にパブリック API に正常に接続して、最終の設定タスクを実行することができます。これらのタスクは、admin アカウントを使用して新規作成したデプロイメントを管理するのに必要です。
現在、director がパブリック API に接続して最終の設定のデプロイ後のステップを完了するのに必要となる既知の要件があります。この要件は、アンダークラウドノードにはパブリック API へのルートが 1 つあることと、そのルートが標準の OpenStack API ポートおよびポート 22 (SSH) で到達可能である必要があることです。 この要件に対応するには、デプロイ後のタスクで使用するコントローラー上の外部ネットワークにアンダークラウドが到達可能かをチェックしておいてください。このような準備をしておくことにより、アンダークラウドはデプロイ後にパブリック API に正常に接続して、最終の設定タスクを実行することができます。これらのタスクは、admin アカウントを使用して新規作成したデプロイメントを管理するのに必要です。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1243306
NovaEnableRbdBackend パラメーターを使用する場合には、一時ストレージが true としてハードコードされています。これは、NovaEnableRbdBackend インスタンスが Ceph Storage 上に cinder バックエンドを使用できないことを意味します。回避策として、以下の行を puppet/hieradata/compute.yaml に追加します。 nova::compute::rbd::ephemeral_storage: false これで一時ストレージが無効になります。
NovaEnableRbdBackend パラメーターを使用する場合には、一時ストレージが true としてハードコードされています。これは、NovaEnableRbdBackend インスタンスが Ceph Storage 上に cinder バックエンドを使用できないことを意味します。回避策として、以下の行を puppet/hieradata/compute.yaml に追加します。 nova::compute::rbd::ephemeral_storage: false これで一時ストレージが無効になります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1241644
openstack-cinder-volume が LVM バックエンドの使用時にオーバークラウドノードが再起動すると、ファイルベースのループバックデバイスは再度作成されません。回避策として、ループバックデバイスを手動で再作成します。 $ sudo losetup /dev/loop2 /var/lib/cinder/cinder-volumes 次に、openstack-cinder-volume を再起動します。openstack-cinder-volume はオーバークラウドコントローラーノードの高可用性クラスター内では、1 回に 1 つのノードでしか実行できません。ただし、ループバックデバイスは、全ノード上に存在します。
openstack-cinder-volume が LVM バックエンドの使用時にオーバークラウドノードが再起動すると、ファイルベースのループバックデバイスは再度作成されません。回避策として、ループバックデバイスを手動で再作成します。 $ sudo losetup /dev/loop2 /var/lib/cinder/cinder-volumes 次に、openstack-cinder-volume を再起動します。openstack-cinder-volume はオーバークラウドコントローラーノードの高可用性クラスター内では、1 回に 1 つのノードでしか実行できません。ただし、ループバックデバイスは、全ノード上に存在します。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1282951
Red Hat OpenStack Platform director のデプロイ時には、bare-metal ノードの電源はオフにして、ironic で「node-state」と「provisioning-state」が正しい必要があります。 たとえば、ironic がノードを「Available, powered-on」で表示されていても、サーバーが実際には電源がオフの状態である場合には、そのノードはデプロイメントには使用できません。 そのため、ironic でのノードの状態と実際のノードの状態を一致させる必要があります。「ironic node-set-power-state <node> [on|off]」と「ironic node-set-provisioning-state <node> available」のいずれか一方または両方を使用して、ironic 内での電源状態がサーバーの実際の状態と一致するようにして、ノードが「Available」とマークされるようにします。 その結果、ironic でのノードの状態が正しくなった後には、ironic は電源状態を正しく管理して、ノードをデプロイできるようになります。
Red Hat OpenStack Platform director のデプロイ時には、bare-metal ノードの電源はオフにして、ironic で「node-state」と「provisioning-state」が正しい必要があります。 たとえば、ironic がノードを「Available, powered-on」で表示されていても、サーバーが実際には電源がオフの状態である場合には、そのノードはデプロイメントには使用できません。 そのため、ironic でのノードの状態と実際のノードの状態を一致させる必要があります。「ironic node-set-power-state <node> [on|off]」と「ironic node-set-provisioning-state <node> available」のいずれか一方または両方を使用して、ironic 内での電源状態がサーバーの実際の状態と一致するようにして、ノードが「Available」とマークされるようにします。 その結果、ironic でのノードの状態が正しくなった後には、ironic は電源状態を正しく管理して、ノードをデプロイできるようになります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1293422
IBM x3550 M5 サーバーには、Red Hat OpenStack Platform で機能する最小限のバージョンのファームウェアが必要です。 そのため、ファームウェアのレベルが古い場合には、デプロイメントの前にアップグレードする必要があります。影響を受けるシステムは、次のバージョン (またはそれ以降のバージョン) にアップグレードする必要があります。 DSA 10.1, IMM2 1.72, UEFI 1.10, Bootcode NA, Broadcom GigE 17.0.4.4a ファームウェアのアップグレード後には、デプロイメントは想定通りに進めることができるはずです。
IBM x3550 M5 サーバーには、Red Hat OpenStack Platform で機能する最小限のバージョンのファームウェアが必要です。 そのため、ファームウェアのレベルが古い場合には、デプロイメントの前にアップグレードする必要があります。影響を受けるシステムは、次のバージョン (またはそれ以降のバージョン) にアップグレードする必要があります。 DSA 10.1, IMM2 1.72, UEFI 1.10, Bootcode NA, Broadcom GigE 17.0.4.4a ファームウェアのアップグレード後には、デプロイメントは想定通りに進めることができるはずです。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1323024
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1368279
Red Hat Ceph を永続ストレージ用バックエンドとして使用する場合には、Compute サービスは利用可能なストレージ容量を正しく計算しません。厳密に言うと、Compute がレプリケーションを考慮に入れず、単に利用可能なストレージを加算してしまいます。その結果、利用可能なストレージ容量は実際の容量を大幅に上回る値が提示され、予期しないストレージオーバーサブスクリプションが発生してしまう可能性があります。 一時ストレージの正しい容量を確認するには、代わりに Ceph サービスに対して直接クエリーを実行してください。
Red Hat Ceph を永続ストレージ用バックエンドとして使用する場合には、Compute サービスは利用可能なストレージ容量を正しく計算しません。厳密に言うと、Compute がレプリケーションを考慮に入れず、単に利用可能なストレージを加算してしまいます。その結果、利用可能なストレージ容量は実際の容量を大幅に上回る値が提示され、予期しないストレージオーバーサブスクリプションが発生してしまう可能性があります。 一時ストレージの正しい容量を確認するには、代わりに Ceph サービスに対して直接クエリーを実行してください。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1394537
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1403380
現在、「Instance.pci_devices」フィールドでは NULL 値を指定可能ですが、「get_instance_pci_devs()」関数はその可能性を許可していません。旧デプロイメント (例: Red Hat OpenStack Platform 9) からインスタンスに渡される場合には「pci_devices」の値が指定されていないと、「None」をリストとして反復を試みてクラッシュします。 この問題の対象範囲には、アップグレードのワークフローの一環としてトリガーされるライブマイグレーションが含まれ、Red Hat OpenStack Platform 9 ホストから Red Hat OpenStack Platform 10 ホストにゲストのライブマイグレーションを試みます。 この問題を解決するためのパッチは特定済みで、Red Hat のお客様にはエラータとして リリースされる予定です。既存インスタンスをライブマイグレーションする方法でローリングアップグレードを予定しているお客様は、このエラータが提供されるまでアップグレードを見合わせることを推奨します。
現在、「Instance.pci_devices」フィールドでは NULL 値を指定可能ですが、「get_instance_pci_devs()」関数はその可能性を許可していません。旧デプロイメント (例: Red Hat OpenStack Platform 9) からインスタンスに渡される場合には「pci_devices」の値が指定されていないと、「None」をリストとして反復を試みてクラッシュします。 この問題の対象範囲には、アップグレードのワークフローの一環としてトリガーされるライブマイグレーションが含まれ、Red Hat OpenStack Platform 9 ホストから Red Hat OpenStack Platform 10 ホストにゲストのライブマイグレーションを試みます。 この問題を解決するためのパッチは特定済みで、Red Hat のお客様にはエラータとして リリースされる予定です。既存インスタンスをライブマイグレーションする方法でローリングアップグレードを予定しているお客様は、このエラータが提供されるまでアップグレードを見合わせることを推奨します。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1391022
Red Hat Enterprise Linux 6 には GRUB Legacy のみが含まれていますが、OpenStack Bare Metal Provisioning サービス (ironic) は GRUB2 のインストールのみをサポートしているため、ローカルブートでパーティションイメージをデプロイすると、ブートローダーのインストール中にエラーが発生します。 回避策としては、ベアメタルインスタンスに RHEL 6 を使用する場合には、フレーバーの設定で、boot_option を local に設定しないようにします。GRUB Legacy がインストール済みの RHEL 6 ディスクイメージ全体をデプロイすることも検討することができます。
Red Hat Enterprise Linux 6 には GRUB Legacy のみが含まれていますが、OpenStack Bare Metal Provisioning サービス (ironic) は GRUB2 のインストールのみをサポートしているため、ローカルブートでパーティションイメージをデプロイすると、ブートローダーのインストール中にエラーが発生します。 回避策としては、ベアメタルインスタンスに RHEL 6 を使用する場合には、フレーバーの設定で、boot_option を local に設定しないようにします。GRUB Legacy がインストール済みの RHEL 6 ディスクイメージ全体をデプロイすることも検討することができます。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1396308
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1384845
オーバークラウドのイメージに、バージョン 2.7.1-4 未満の 「tuned」 が同梱されている場合には、「tuned」 パッケージの更新をそのオーバークラウドに手動で適用する必要があります。「tuned」バージョンが 2.7.1-4 以降の場合には、「tuned」にコアの一覧を提供してプロファイルをアクティブ化する必要があります。以下に例を示します。 # echo "isolated_cores=2,4,6,8,10,12,14,18,20,22,24,26,28,30" >> /etc/tuned/cpu-partitioning-variables.conf # tuned-adm profile cpu-partitioning
オーバークラウドのイメージに、バージョン 2.7.1-4 未満の 「tuned」 が同梱されている場合には、「tuned」 パッケージの更新をそのオーバークラウドに手動で適用する必要があります。「tuned」バージョンが 2.7.1-4 以降の場合には、「tuned」にコアの一覧を提供してプロファイルをアクティブ化する必要があります。以下に例を示します。 # echo "isolated_cores=2,4,6,8,10,12,14,18,20,22,24,26,28,30" >> /etc/tuned/cpu-partitioning-variables.conf # tuned-adm profile cpu-partitioning
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1385034
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1366356
ユーザー空間データパス (DPDK) を使用する場合には、一部の非 PMD スレッドは PMD を実行するのと同じ CPU 上で実行されます (「pmd-cpu-mask」で設定されます)。これは、PMD が割り込みされ、レイテンシースパイクやドロップなどが発生する原因となります。 今回の更新では post-install.yaml ファイルの修正が実装されました。このファイルは https://access.redhat.com/documentation/en/red-hat-openstack-platform/10/single/network-functions-virtualization-configuration-guide/#ap-ovsdpdk-post-install に記載されています。
ユーザー空間データパス (DPDK) を使用する場合には、一部の非 PMD スレッドは PMD を実行するのと同じ CPU 上で実行されます (「pmd-cpu-mask」で設定されます)。これは、PMD が割り込みされ、レイテンシースパイクやドロップなどが発生する原因となります。 今回の更新では post-install.yaml ファイルの修正が実装されました。このファイルは https://access.redhat.com/documentation/en/red-hat-openstack-platform/10/single/network-functions-virtualization-configuration-guide/#ap-ovsdpdk-post-install に記載されています。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1372804
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1394402
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1383627
「openstack baremetal import --json instackenv.json」を使用してインポートしたノードは、インポートを試みる前に電源をオフにする必要があります。ノードの電源がオンの場合には、Ironic はノードの追加やイントロスペクションを試みません。 この回避策として、「openstack baremetal import --json instackenv.json」を実行する前に全オーバークラウドノードの電源をオフにすることができます。 その結果、ノードの電源がオフになっている場合にはインポートが正常に機能するはずです。
「openstack baremetal import --json instackenv.json」を使用してインポートしたノードは、インポートを試みる前に電源をオフにする必要があります。ノードの電源がオンの場合には、Ironic はノードの追加やイントロスペクションを試みません。 この回避策として、「openstack baremetal import --json instackenv.json」を実行する前に全オーバークラウドノードの電源をオフにすることができます。 その結果、ノードの電源がオフになっている場合にはインポートが正常に機能するはずです。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1383930
DHCP HA を使用する場合には、コンポーザブルロールを使用して、「NeutronDhcpAgentsPerNetwork」の値を dhcp-agent 数に等しい値または 3 のいずれか低い方に設定すべきです。このように設定しなかった場合には、この値はデフォルトで「ControllerCount」に設定され、各ネットワークで多数の DHCP サーバーの起動に対応するために dhcp-agent 数が十分でない場合があるために最適ではありません。
DHCP HA を使用する場合には、コンポーザブルロールを使用して、「NeutronDhcpAgentsPerNetwork」の値を dhcp-agent 数に等しい値または 3 のいずれか低い方に設定すべきです。このように設定しなかった場合には、この値はデフォルトで「ControllerCount」に設定され、各ネットワークで多数の DHCP サーバーの起動に対応するために dhcp-agent 数が十分でない場合があるために最適ではありません。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1302081
「AllocationPools」IPv6 ネットワークおよび IP の割り当てプールに入力するアドレス範囲は、RFC 5952 に従って有効な形式で入力する必要があります。エントリーが不完全だと機能せず、無効なエントリーによりエラーが発生します。 そのため、IPv6 アドレスは有効な形式で入力する必要があります。ゼロが繰り返される場合には「::」に置き換えることができます。 たとえば、「fd00:0001:0000:0000:00a1:00b2:00c3:0010」という IP アドレスは、「fd00:1::a1:b2:c3:10」と示すことができますが、「fd00:01::0b2:0c3:10」には無効な先頭ゼロ (01, 0b2, 0c3) が含まれているので使用できません。このフィールドでは、先頭のゼロを切り捨てるか、完全に埋め込む必要があります。
「AllocationPools」IPv6 ネットワークおよび IP の割り当てプールに入力するアドレス範囲は、RFC 5952 に従って有効な形式で入力する必要があります。エントリーが不完全だと機能せず、無効なエントリーによりエラーが発生します。 そのため、IPv6 アドレスは有効な形式で入力する必要があります。ゼロが繰り返される場合には「::」に置き換えることができます。 たとえば、「fd00:0001:0000:0000:00a1:00b2:00c3:0010」という IP アドレスは、「fd00:1::a1:b2:c3:10」と示すことができますが、「fd00:01::0b2:0c3:10」には無効な先頭ゼロ (01, 0b2, 0c3) が含まれているので使用できません。このフィールドでは、先頭のゼロを切り捨てるか、完全に埋め込む必要があります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1204259
Glance で、glance.store.http.Store は、/etc/glance/glance.conf に known_store として設定されていないため、Glance クライアントで --copy-from 引数を使用してイメージを作成することはできません。このコマンドを実行すると、「400 Bad Request」エラーが表示されて操作が失敗します。回避策として、/etc/glance/glance-api.conf を編集して、「store」設定オプションのリストに glance.store.http.Store を追加してから、openstack-glance-api サーバーを再起動します。これにより、--copy-from 引数を使用した Glance イメージの作成を正常に実行できるようになります。
Glance で、glance.store.http.Store は、/etc/glance/glance.conf に known_store として設定されていないため、Glance クライアントで --copy-from 引数を使用してイメージを作成することはできません。このコマンドを実行すると、「400 Bad Request」エラーが表示されて操作が失敗します。回避策として、/etc/glance/glance-api.conf を編集して、「store」設定オプションのリストに glance.store.http.Store を追加してから、openstack-glance-api サーバーを再起動します。これにより、--copy-from 引数を使用した Glance イメージの作成を正常に実行できるようになります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1245826
「openstack overcloud update stack」コマンドは、背後で操作が継続するにもかかわらず、即時に出力を返していました。このコマンドは対話的でないため、永遠に実行されるように見えました。そのような場合には、「-i」のフラグを付けてコマンドを実行すると、手動での対話が必要な場合にユーザーにプロンプトが表示されるようになります。
「openstack overcloud update stack」コマンドは、背後で操作が継続するにもかかわらず、即時に出力を返していました。このコマンドは対話的でないため、永遠に実行されるように見えました。そのような場合には、「-i」のフラグを付けてコマンドを実行すると、手動での対話が必要な場合にユーザーにプロンプトが表示されるようになります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - BZ#1249210
タイミングの問題により、オーバークラウドの neutron サービスは正しく自動起動しません。これは、インスタンスがアクセスできないことを意味します。回避策として、コントローラーノードクラスターで以下のコマンドを実行することができます。 $ sudo pcs resource debug-start neutron-l3-agent これでインスタンスが適切に起動するようになります。
タイミングの問題により、オーバークラウドの neutron サービスは正しく自動起動しません。これは、インスタンスがアクセスできないことを意味します。回避策として、コントローラーノードクラスターで以下のコマンドを実行することができます。 $ sudo pcs resource debug-start neutron-l3-agent これでインスタンスが適切に起動するようになります。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow