5.2. 環境のモニタリング


このセクションでは、テスト中の環境のモニタリングに焦点を当てます。このセクションでは、変更を確認するために必要なモニターのみを説明します。モニターは専用のターミナルから実行することを推奨します。テスト中に変化を検出できるように、テストを開始する前にモニタリングを開始することを推奨します。

便利なコマンド セクションで、さらに多くの例を紹介しています。

5.2.1. プライマリーノードの検出

プライマリーノードを検出してフェイルオーバーを監視するか、プライマリーノードで実行したときにレプリケーションステータスに関する情報のみを提供する特定のコマンドを実行する必要があります。

プライマリーノードを検出するには、<sid>adm ユーザーとして次のコマンドを実行します。

clusternode1:rh2adm> watch -n 5 'hdbnsutil -sr_stateConfiguration | egrep -e "primary masters|^mode"'
Copy to Clipboard Toggle word wrap

出力例 (clusternode2 がプライマリーデータベースの場合):

mode: syncmem
primary masters: clusternode2
Copy to Clipboard Toggle word wrap

プライマリーノードを特定する 2 つ目の方法は、クラスターノード上で root として次のコマンドを実行することです。

# watch -n 5 'pcs status --full'
Copy to Clipboard Toggle word wrap

プライマリーデータベースを実行するノードの出力は次のとおりです。

mode: primary
Copy to Clipboard Toggle word wrap

5.2.2. レプリケーションステータスの確認

レプリケーションのステータスは、プライマリーデータベースノードとセカンダリーデータベースノード間の関係と、レプリケーションの現在のステータスを示します。

レプリケーションのステータスを確認するには、<sid>adm ユーザーとして次のコマンドを実行します。

clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration
Copy to Clipboard Toggle word wrap

システムレプリケーションステータスの変更を永続的に監視したい場合は、次のコマンドを実行してください。

clusternode1:rh2adm> watch -n 5 'python
/usr/sap/${SAPSYSTEMNAME}/HDB${TINSTANCE}/exe/python_support/systemReplicationStatus.py ; echo Status $?'
Copy to Clipboard Toggle word wrap

この例では、レプリケーションのステータスを繰り返し取得します。また、現在の戻りコードを確認します。
戻りコード (ステータス) が 15 である限り、レプリケーションのステータスは正常です。他の戻りコードは次のとおりです。

  • 10: NoHSR
  • 11: Error
  • 12: Unknown
  • 13: Initializing
  • 14: Syncing
  • 15: Active

新しいセカンダリーを登録する場合は、プライマリーノード上の別のウィンドウでコマンドを実行し、レプリケーションの進行状況を確認できます。フェイルオーバーを監視する場合は、前のプライマリーデータベースサーバーと新しいプライマリーデータベースサーバーで並行してコマンドを実行できます。詳細は、SAP HANA System Replication のステータスの確認 を参照してください。

5.2.3. /var/log/messages のエントリーの確認

Pacemaker は、/var/log/messages ファイルに多くの情報を書き込みます。フェイルオーバー中に、大量のメッセージがこのメッセージファイルに書き込まれます。SAP HANA リソースエージェントに応じて重要なメッセージのみを追跡できるようにするには、Pacemaker SAP リソースの詳細なアクティビティーをフィルターすると便利です。これは、単一のクラスターノード上のメッセージファイルを確認する場合に十分です。

たとえば、次のエイリアスを使用できます。

# tmsl='tail -1000f /var/log/messages | egrep -s "Setting master-rsc_SAPHana_${SAPSYSTEMNAME}_HDB${TINSTANCE}|sr_register|WAITING4LPA|PROMOTED|DEMOTED|UNDEFINED|master_walk|SWAIT|WaitforStopped|FAILED|LPT"'
Copy to Clipboard Toggle word wrap

このエイリアスを別のウィンドウで実行して、テストの進行状況を監視します。フェイルオーバーと同期状態の監視 の例も参照してください。

5.2.4. クラスターの状態

クラスターのステータスを確認するにはいくつかの方法があります。

  • クラスターが実行中かどうかを確認します。

    • pcs cluster status
  • クラスターとすべてのリソースを確認します。

    • pcs status
  • クラスター、すべてのリソース、およびすべてのノード属性を確認します。

    • pcs status --full
  • リソースのみを確認します。

    • pcs resource

pcs status --full コマンドを使用すると、必要な情報がすべて得られます。変更を監視するには、このコマンドを watch と一緒に実行できます。

# pcs status --full
Copy to Clipboard Toggle word wrap

変更を確認する場合は、別のウィンドウで watch コマンドを実行できます。

# watch pcs status --full
Copy to Clipboard Toggle word wrap

出力例とその他のオプションは、クラスターのステータスの確認 を参照してください。

5.2.5. 残留物の検出

環境が次のテストを実行できる状態にあることを確認するには、以前のテストで残ったものを修正または削除する必要があります。

  • stonith は、クラスター内のノードをフェンスするために使用します。

    • 検出: [root@clusternode1]# pcs stonith history
    • 修正: [root@clusternode1]# pcs stonith cleanup
  • 複数のプライマリーデータベース:

    • 検出: clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration | grep -i primary

      同じプライマリーを持つすべてのノードを識別する必要があります。

    • 修正: clusternode1:rh2adm> は、--force_full_replica オプションを使用して間違ったプライマリーを再登録します。
  • 移動により発生した場所の制約:

    • 検出: [root@clusternode1]# pcs constraint location

      警告セクションを確認します。

    • 修正: [root@clusternode1]# pcs resource clear <clone-resource-which was moved>
  • セカンダリーレプリケーション関係:

    • 検出: プライマリーデータベースで clusternode1:rh2adm> python ${DIR_EXECUTABLES}/python_support/systemReplicationStatus.py を実行します。
    • 修正: セカンダリーデータベースを登録解除して再登録します。
  • siteReplicationMode を確認します (すべての SAP HANA ノードで同じ出力が表示されます)

    • clusternode1:rh2adm> hdbnsutil -sr_state --sapcontrol=1 |grep site.*Mode
  • Pcs プロパティー:

    • 検出: [root@clusternode1]# pcs property config
    • 修正: [root@clusternode1]# pcs property set <key=value>
    • maintenance_mode をクリア
    • [root@clusternode1]# pcs property set maintenance-mode=false
  • log_mode:

    • 検出: clusternode1:rh2adm> python systemReplicationStatus.py

      通常は log_mode が必要であるという応答がレプリケーションのステータスで返されます。log_mode は、hdbsql を使用した Inifile の内容の確認 で説明されている方法で検出できます。

    • 修正: log_mode を normal に変更し、プライマリーデータベースを再起動します。
  • CIB エントリー:

    • 検出: クラスター情報ベース内の SFAIL エントリー。

      CIB エントリーを検索して削除するには、クラスターの整合性の確認 を参照してください。

  • クリーンアップ/クリア:

    • 検出: [root@clusternode1]# pcs status --full

      場合によっては、エラーや警告が表示されることがあります。リソースをクリーンアップ/クリアしても、すべてが正常であれば何も起こりません。次のテストを実行する前に、環境をクリーンアップできます。

    • 修正の例:

      [root@clusternode1]# pcs resource clear <name-of-the-clone-resource>

      [root@clusternode1]# pcs resource cleanup <name-of-the-clone-resource>

これは、既存の環境に問題があるか確認する場合にも役立ちます。詳細は、便利なコマンド を参照してください。

Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2026 Red Hat
トップに戻る