4.11. 高可用性およびクラスター
Podman コンテナーで etcd を管理するための新しいリソースエージェントが利用可能になりました
この更新前は、Red Hat High Availability に、Podman コンテナー内で稼働する etcd を管理するためのリソースエージェントが用意されていませんでした。
この機能拡張により、新しい podman-etcd リソースエージェントが追加されました。
その結果、Podman コンテナーで実行される etcd のリソースを作成および管理できるようになります。このエージェントは、Two Node OpenShift with Fencing (TNF) ソリューションに必要なコンポーネントです。
Filesystem リソースエージェントが aznfs ファイルシステムタイプをサポートするようになりました
この更新前は、クラスター内の Azure Network File System のファイル共有を管理するには、fstype=nfs を使用して Filesystem リソースエージェントを設定する必要がありました。この方法では、転送中の暗号化など、Azure 固有の機能がサポートされていませんでした。
この更新により、Filesystem リソースエージェントは、ファイルシステムタイプとして aznfs をサポートするようになりました。
その結果、Azure Network File System のファイル共有を管理するために、Filesystem リソースの作成時に fstype=aznfs を設定できるようになりました。これにより、Azure 固有の機能のサポートが可能になります。この機能を使用するには、Microsoft リポジトリーの aznfs クライアントパッケージをすべてのクラスターノードにインストールする必要があることに注意してください。
Oracle Database 23ai がクラスターリソースとしてサポートされるようになりました
この更新前は、Oracle データベースのリソースエージェントが Oracle Database 23ai リリースでの使用についてテストされていませんでした。したがって、このバージョンは、Pacemaker クラスター内の高可用性リソースとしてサポートされていませんでした。
この更新により、既存の Oracle リソースエージェントが、Oracle Database 23ai で正常にテストおよび検証済みのものになりました。
その結果、Pacemaker は Oracle Database 23ai インスタンスの管理をサポートするようになりました。これにより、このバージョンの完全にテストされた高可用性構成が可能になりました。
Jira:RHEL-85220[1]
fence_sbd エージェントが SBD デバイスを自動的に検出できるようになりました
この更新前は、fence_sbd リソースを設定するときに、devices パラメーターを使用して SBD デバイスパスを明示的に指定する必要がありました。
この更新により、fence_sbd エージェントがシステムからデバイス設定を取得できるようになりました。
そのため、fence_sbd リソースの作成時に devices パラメーターを設定しなかった場合、エージェントが /etc/sysconfig/sbd ファイル内の SBD_DEVICE 変数で指定されたデバイスを自動的に使用します。
ウォッチドッグデバイスのリストで提供される情報がより詳細なものになりました
この更新前は、利用可能なウォッチドッグデバイスをリスト表示する場合、出力に /dev/watchdog0 などのデバイスパスしか表示されませんでした。そのため、管理者が同じシステム上の複数のデバイスを区別することが困難でした。
この更新により、出力に各ウォッチドッグのデバイスパス、ID、およびドライバーが含まれるようになりました。これにより、正しいデバイスを簡単に特定して選択できます。
最後のフェンシングデバイスを削除する前に pcs がユーザーに警告します
この更新前は、ユーザーがクラスターから最後のフェンシングデバイスを無効化または削除することを、pcs が警告なしで許可していました。これにより、意図せずクラスターが STONITH も SBD フェンシングも設定されていないサポート対象外の状態になることがありました。
この機能拡張により、すべてのフェンスメカニズムが誤って削除されるのを防ぐために、安全チェックが pcs に組み込まれました。
その結果、クラスターからフェンシングがなくなる操作を実行しようとすると、pcs がデフォルトでエラーを表示し、変更をブロックするようになりました。たとえば、SBD が無効なときに最後の STONITH リソースを削除しようとすると、この問題が発生します。必要に応じて、この安全チェックを無効にして強制的に変更することができます。
pcs node attribute および pcs node utilization コマンドが、複数の出力形式をサポートするようになりました
以前は、pcs node attribute コマンドと pcs node utilization コマンドの出力は、人間が判読できるプレーンテキスト形式でのみ表示されていました。この形式は、機械による解析や設定の簡単な複製には適していませんでした。
この機能拡張により、pcs node attribute コマンドと pcs node utilization コマンドに新しい --output-format オプションが追加されました。
その結果、設定済みのノードの属性と使用率を、以下に示す 3 つの形式のいずれかで表示できるようになりました。
-
text: 出力をプレーンテキストで表示します。これがデフォルトの形式です。 -
json: 出力を機械可読な JSON 形式で表示します。これはスクリプト作成や自動化に役立ちます。 -
cmd: 出力を一連のpcsコマンドとして表示します。これを使用して、別のシステムで同じ設定を再現できます。
pcs alert config コマンドが複数の出力形式をサポートするようになりました
以前は、pcs alert config コマンドは、人間が判読できるプレーンテキスト形式でのみ出力を表示していました。この形式は、機械による解析や設定の簡単な複製には適していませんでした。
この機能拡張により、pcs alert config コマンドに新しい --output-format オプションが追加されました。
その結果、設定済みのアラートを、以下に示す 3 つの形式のいずれかで表示できるようになりました。
-
text: 出力をプレーンテキストで表示します。これがデフォルトの形式です。 -
json: 出力を機械可読な JSON 形式で表示します。これはスクリプト作成や自動化に役立ちます。 -
cmd: 出力を一連のpcsコマンドとして表示します。これを使用すると、別のシステムで同じアラート設定を再現できます。
pcs が CIB の潜在的な問題を自動的に検証するようになりました
以前は、pcs ユーティリティーは Cluster Information Base (CIB) に対して高度な検証チェックを自動的に実行していませんでした。そのため、日常的な操作中に特定のクラスターの誤った設定が検出されないことがありました。
この機能拡張により、pcs が更新され、Pacemaker の CIB 検証ツールがワークフローに統合されました。
その結果、pcs status、pcs cluster edit、または pcs cluster cib-push コマンドを実行すると、pcs が自動的に検証チェックを実行し、結果を表示するようになりました。
pcs が提供する CIB 更新の失敗に関するエラーメッセージがより詳細なものになりました
以前は、pcs cluster edit コマンドまたは pcs cluster cib-push コマンドの使用時に CIB 更新が失敗すると、Pacemaker によって一般的なエラーメッセージが表示されていました。失敗の具体的な理由は説明されていなかったため、無効な設定のトラブルシューティングが困難でした。
この機能拡張により、pcs は、CIB プッシュが失敗したときに Pacemaker から詳細な検証チェックを要求するように更新されました。
その結果、CIB 更新が拒否されたときに、pcs は設定の問題点を説明する具体的なエラーメッセージを表示するようになりました。
クラスターの名前を変更するための新しい pcs コマンドが利用可能になりました
以前は、pcs コマンドを使用して既存のクラスターの名前を変更できませんでした。管理者は一連の手動手順を実行する必要がありましたが、これは複雑でエラーが発生する可能性がありました。
この機能拡張により、pcs cluster rename コマンドが導入されました。
その結果、既存のクラスターの名前を簡単に変更できるようになりました。クラスターの名前を変更するには、次のコマンドを実行します。
pcs cluster rename <new-name>
pcs cluster rename <new-name>
Nutanix AHV 仮想化用の新しいフェンスエージェントが利用可能になりました
以前は、Red Hat High Availability Add-On が Nutanix Acropolis Hypervisor (AHV) 環境専用のフェンスエージェントを提供していませんでした。
この機能拡張により、fence_nutanix エージェントが追加されます。
その結果、Nutanix AHV プラットフォーム上で稼働するクラスターノードに対して STONITH を設定できるようになり、完全にサポートされた高可用性デプロイメントが可能になります。
Jira:RHEL-68321[1]
pcs resource meta コマンドがバンドルをサポートするようになり、ゲストノードの誤設定を防ぐように改善されました
以前は、pcs resource meta コマンドはバンドルリソースのメタ属性の管理をサポートしていませんでした。さらに、このコマンドでは、ユーザーがゲストノードの接続パラメーターを誤って変更するのを防ぐことができず、リソースの設定ミスが発生する可能性がありました。
この機能拡張により、pcs resource meta コマンドが書き換えられました。
その結果、pcs resource meta を使用してバンドルリソースのメタ属性を更新できるようになりました。これに加えて、このコマンドをゲストノードで使用する際に、接続パラメーターの意図しない変更を防ぎ、設定ミスの可能性を回避できるようになりました。
IPaddr2 リソースエージェントがネットワークリンクの障害を検出するようになりました
この更新前は、IPaddr2 リソースエージェントはネットワークインターフェイスのリンク状態を監視していませんでした。その結果、基盤となるインターフェイスが DOWN または LOWERLAYERDOWN 状態であっても、IPaddr2 リソースはノード上で成功と報告し続けていました。これにより、クラスターが別のノードでそのリソースを回復することが妨げられていました。
このリリースでは、IPaddr2 エージェントが強化され、インターフェイスのリンクステータスを確認できるようになりました。
その結果、ネットワークインターフェイスがダウンした場合に IPaddr2 リソースが正しく失敗し、適切なフェイルオーバーが可能になります。この新しいデフォルトの動作は、リソースの設定で check_link_status=false パラメーターを設定することで無効にできます。
Jira:RHEL-7688[1]
fence_aws エージェントが即時電源オフをサポートするようになりました
以前は、fence_aws エージェントが off または reboot アクションを実行すると、インスタンスのグレースフルシャットダウンがトリガーされていました。これにより、ノードの電源がすぐにオフにならないため、フェンシングプロセスに遅延が発生していました。
この更新により、fence_aws エージェントに新しい skip_os_shutdown パラメーターが追加されました。このパラメーターは、Y-stream リリースではデフォルトで有効になっており、Z-stream リリースではデフォルトで無効になっています。
その結果、skip_os_shutdown が true に設定されている場合、fence_aws エージェントはグレースフルシャットダウンを回避し、インスタンスの即時ハード電源オフを実行します。