監視ガイド


Red Hat Gluster Storage 3.5

Gluster クラスターの監視

概要

本ガイドでは、Red Hat Gluster Storage Web Administration を使用して Gluster クラスターをインポートする方法や、Gluster クラスターの正常性、パフォーマンス、ステータスを監視する方法についての基本情報を提供します。監視およびメトリクス視覚化は、Web 管理インターフェースに統合される Grafana モニタリングプラットフォームによって提供されます。
多様性を受け入れるオープンソースの強化
Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。まずは、マスター (master)、スレーブ (slave)、ブラックリスト (blacklist)、ホワイトリスト (whitelist) の 4 つの用語の置き換えから始めます。この取り組みは膨大な作業を要するため、今後の複数のリリースで段階的に用語の置き換えを実施して参ります。詳細は、弊社の CTO、Chris Wright のメッセージを参照してください。

第1章 概要

Red Hat Gluster Storage Web Administration は、Red Hat Gluster Storage 3.5 の視覚的な監視およびメトリクスインフラストラクチャーを提供し、Red Hat Gluster Storage 環境を監視する主要な方法です。Red Hat Gluster Storage Web Administration は Tendrl アップストリームプロジェクトをベースとしており、インストール用に Ansible 自動化を使用します。Red Hat Gluster Storage Web Administration の主な目的は、Red Hat Storage Gluster クラスターの深いメトリックと視覚化と、ストレージノード、ボリューム、ブリックなどの関連する物理ストレージ要素を提供することです。

主な特長

  1. クラスター、ホスト、ボリューム、およびブリックの監視ダッシュボード
  2. クラスター、ホスト、およびボリュームのトップレベルのビュー
  3. SNMPv3 設定およびアラート
  4. ユーザー管理
  5. Gluster クラスターのインポート

第2章 クラスターのインポート

Web Administration がインストールされ、準備が整ったら、クラスターの管理をインポートおよび開始できます。インストール手順については、『Red Hat Gluster Storage Web Administration クイックスタートガイド』の「Web 管理のインストール」の章を参照してください。

2.1. クラスターのインポート

以下の手順では、Gluster クラスターをインポートする手順の概要を説明します。

手順クラスターのインポート

  1. Web 管理インターフェースにログインします。ユーザー名とパスワードを入力し、ログイン をクリックします。

    注記

    デフォルトのユーザー名は admin で、デフォルトのパスワードは adminuser です。

    図2.1 ログインページ

  2. デフォルトのランディングインターフェースには、インポートできるすべてのクラスターの一覧が表示されます。インポートするクラスターを見つけ、インポート をクリックします。

    図2.2 クラスターのインポート

  3. ユーザーフレンドリーなクラスター名を入力します。デフォルトでは、すべてのボリュームで有効化 オプションが選択されます。

    図2.3 クラスター名

    注記

    クラスター名が指定されていない場合、システムは無作為に生成された uuid をクラスター名として割り当てます。ただし、クラスターの一覧からクラスターを簡単に特定するために、ユーザーフレンドリーなクラスター名を入力することが推奨されます。

  4. インポート をクリックして続行します。
  1. クラスターのインポート要求が送信されます。タスクの進捗を表示するには、View Task Progress をクリックします。

    図2.4 タスクの詳細

  2. All Clusters インターフェースビューに移動します。クラスターが正常にインポートされ、使用できる状態になります。

図2.5 Cluster Ready

2.1.1. インポートクラスターのトラブルシューティング

シナリオ:Import cluster UI ボタンは、クラスターのインポート操作の失敗後に無効になります。

このシナリオでは、クラスターのインポートに失敗すると、Import ボタンが無効になります。

解決策

クラスターのインポート操作が失敗した理由を調査して、問題を解決します。失敗した操作の詳細を表示するには、Web Administration 環境の All Clusters インターフェースに移動します。クラスター一覧で、インポートを試みたクラスターを見つけ、Import Failed status ラベルの横にある View Details をクリックします。

失敗したクラスターインポート操作の理由を確認して、問題を解決します。問題の解決後に、クラスターの管理を解除してから、クラスターを再インポートします。クラスターの管理対象外の手順については、本ガイドの「 Unmanaging Cluster 」セクションに移動します。

2.1.2. ボリュームのプロファイリング

ボリュームのプロファイリングにより、特定のクラスターについてのボリュームごとに追加の Telemetry 情報を取得できます。これは、トラブルシューティング、容量計画、およびパフォーマンスチューニングに役立ちます。

ボリュームのプロファイリングはクラスターごとに有効または無効にできます。また、クラスターが Web 管理インターフェースを使用してアクティブに管理および監視される場合にボリュームごとに有効または無効にできます。

注記

ボリュームのプロファイリングを有効にすると、幅広いメトリクスが収集され、CPU やメモリーなどのシステムリソース時にパフォーマンスの低下がボリュームプロファイリングデータ収集に使用される可能性があります。

クラスターレベルでのボリュームのプロファイリング

クラスターレベルでボリュームのプロファイリングを有効または無効にするには、以下を実行します。

  1. Web 管理インターフェースにログインします。
  2. クラスター の一覧から、クラスターを見つけ、ボリュームのプロファイリング を無効にします。

    注記

    クラスターの一覧は、ログイン後のデフォルトのランディングインターフェースであり、Interface スイッチャーが All Clusters 上にある。

  3. 右側の Dashboard ボタンの横にある、垂直の省略記号をクリックします。
  4. インラインメニューが開きます。現在の状態に応じて、Disable Profiling または Enable Profiling をクリックします。以下のサンプル画面で、Volume Profiling オプションが有効になっています。Disable Profiling をクリックして無効にします。

    図2.6 ボリュームのプロファイリングの無効化

  5. disable プロファイリングタスクが送信および処理されます。処理後、ボリュームのプロファイリングは正常に無効になります。

図2.7 ボリュームのプロファイリングの無効化

ボリュームレベルでのボリュームのプロファイリング

ボリュームレベルでボリュームのプロファイリングを有効または無効にするには、以下を実行します。

  1. Web 管理インターフェースにログインし、インターフェース 切り替え ドロップダウンから特定のクラスターを選択します。
  2. 特定のクラスターを選択すると、左側の垂直ナビゲーションペインが公開されます。
  3. ナビゲーションペインで、ボリューム をクリックします。Volumes ビューが表示され、クラスターのすべての Volumes 部分が表示されます。

    図2.8 ボリュームビュー

  4. ボリュームを見つけ、現在の状態に応じて Disable Profiling または Enable Profiling をクリックします。以下のサンプル画面で、Volume Profiling が有効になっています。ボリュームのプロファイリングを無効にするには、Disable Profiling をクリックします。

    図2.9 ボリュームのプロファイリングの無効化

  5. disable プロファイリングタスクが送信および処理されます。処理後、ボリュームのプロファイリングは正常に無効になります。

図2.10 ボリュームのプロファイリングの無効化

ボリュームのプロファイリングメトリクス

ボリュームのプロファイリングが無効になっていると、以下のメトリクスは Grafana ダッシュボードに表示されません。それに応じてボリュームのプロファイリングを表示、有効化、無効化するために必要なメトリクスに基づいている。

ボリュームのプロファイリングに関する詳細は、『Red Hat Gluster Storage Administration Guide』の「 Monitoring Red Hat Gluster Storage Gluster Workload 」の章を参照してください。

Expand
表2.1 ボリュームのプロファイリングメトリクス
Grafana ダッシュボードレベル ダッシュボードセクションパネルおよびメトリクス

Cluster Dashboard

at-a-glance

IOPS

ホストダッシュボード

at-a-glance

ブリック IOPS

ボリュームダッシュボード

パフォーマンス

IOPS

ボリュームダッシュボード

プロファイリング情報

ロック用ファイル操作

ボリュームダッシュボード

プロファイリング情報

上位ファイル操作

ボリュームダッシュボード

プロファイリング情報

読み取り/書き込みのファイル操作

ボリュームダッシュボード

プロファイリング情報

Inode 操作のファイル操作

ボリュームダッシュボード

プロファイリング情報

エントリー操作のファイル操作

ブリックダッシュボード

at-a-glance

IOPS

第3章 クラスター拡張

Web 管理環境ですでにインポートおよび管理される既存の Gluster クラスターを拡張するには、以下の一連のアクションを実行します。

新規ノードの作成

Web 管理インターフェースでクラスター拡張を開始する前に、Web 管理 でインポートされる新しい Gluster Storage ノードを作成します。詳しい手順は、『 Red Hat Gluster Storage Administration Guide 』の「 Expanding Volumes 」セクションを参照してください。

新規アラート

新規ノードでクラスターを正常に拡張した後に、以下の画面に Web Administration インターフェースの Notifications パネルにアラートが生成されます。

この画面では、新しいピアが以前のクラスター拡張プロセスで作成された新しいストレージノードを表します。

新規イベント

さらに、以下の画面に表示されるように、拡張用の新しいストレージノードの可用性について新規イベントも生成されます。

新規ノード向けの Tendrl-ansible インストールの実行

ストレージノードが Web 管理によって識別されたら、インベントリーファイルに新規ホストを追加して、10 個のdrl-ansible インストールを実行します。詳細なインストール手順は、『Red Hat Gluster Storage Web Administration クイックスタートガイド』の「Web 管理のインストール」の章を参照してください。

重要

TLS ベースのクライアントサーバー認証を実装している場合、10drl-ansible インストールを実行する前に TLS 暗号化証明書を新規ノードにインストールし、デプロイし、クラスターの拡張に失敗するのを回避します。TLS 暗号化の設定に関する詳細は、『Red Hat Gluster Storage Web Administration クイックスタートガイド』の「TLS 暗号 化設定」の章を参照してください。

Web Administration Environment の Cluster を展開します。

10drl-ansible の実行後に、拡張クラスターオプションが Web 管理インターフェースで利用可能になります。以下の手順に従って、クラスターを拡張します。

手順クラスターの拡張

  1. Web 管理インターフェースにログインし、インターフェースセレクターのドロップダウンから All Clusters インターフェースをクリックします。
  2. Clusters ビューで、拡張するクラスターを見つけます。これは Expansion 必須 としてラベル付けされます。

  3. クラスター行の右端で、垂直の省略記号をクリックし、Expand をクリックします。

  4. 追加する利用可能なホストが一覧表示されます。Expand をクリックします。

  5. クラスター拡張タスクが送信されます。

  6. クラスターが正常に拡張され、使用できる状態になります。

3.1. クラスター拡張のトラブルシューティング

シナリオ:クラスター拡張タスクが失敗しました。

このシナリオでは、クラスターの計画タスクは失敗します。

解決策

クラスターの拡張に失敗した場合は、10 個のdrl-ansible が正常に実行され、ノードエージェントが正しく設定されていることを確認してください。エラーが原因でクラスターの拡張に失敗した場合は、影響を受けるノードでエラーを解決し、Expand Cluster アクションを再度実行します。

tendrl-ansible 実行手順を検証するには、『Red Hat Gluster Storage Web Administration Guide』の「 Web Administration Installation 」セクションを参照してください。

クラスターを拡張するための詳しい説明は、本ガイドの「 Cluster Expansion 」セクションを参照してください。

第4章 クラスターの管理解除

以下は、クラスターの管理を解除する理由です。

  1. Import cluster が失敗する
  2. 管理対象外でモニタリングに使用されるクラスターの削除
  3. 孤立したクラスターエントリーを削除する方法

Web 管理によるクラスターの管理解除

クラスターの管理を解除するには、以下を実行します。

  1. Web 管理インターフェースにログインし、ドロップダウンメニューから All Clusters ビューを選択します。
  2. インポートしたクラスターの一覧からクラスターを見つけます。クラスター行の右端で、垂直の省略記号をクリックし、Unmanage をクリックし ます

  3. 確認ボックスが表示されます。Unmanage をクリック て続行します。

  4. unmanage cluster タスクが送信される。タスクの進捗を表示するには、View Task Progress をクリックします。

  5. ステータスは、アンマネージドタスクが正常に完了した後に Completed が表示されます。
注記

クラスターが非管理モードになると、Web 管理環境に再インポートするためにすぐに再インポートされることはありません。クラスターが非管理モードの場合は、クラスターのノードと同期するために 10 台 のdrl-node-agent サービスを使用します。クラスター内のノードの数に基づいて、管理外のクラスターが Web 管理環境に再び表示されるまで 60 秒から数分間の遅延が予想されます。

4.1. Graphite および Carbon Data Archival

Graphite および Carbon Data Archival

クラスターの管理解除プロセスが開始されると、クラスターメトリクスデータのアーカイブの同時プロセスが開始されます。クラスターの管理解除の操作が正常に終了したら、Graphite および Carbon メトリクスデータが Web 管理サーバーの以下のパスにアーカイブされます。

/var/lib/carbon/whisper/tendrl/archive/clusters
Copy to Clipboard Toggle word wrap

アーカイブされたデータのサイズは、管理対象外のクラスターのサイズによって異なります。アーカイブされたデータを保存するか、削除してディスク領域を解放できます。

4.2. グラフィックデータベースメトリクスの保持

Graphite Web サービスは、collectd を使用して収集される Telemetry データのリポジトリーです。

メトリクス保持期間の変更

デフォルトでは、Graphite は 180 日間クラスターメトリクスを保持します。特定クラスターのデフォルトのメトリクス保持期間を変更するには、以下の手順を実行します。

  1. 『Red Hat Gluster Storage Web Administration Guide』に概説されている「 Unmanage Cluster 」の手順に従って、クラスターの管理を解除します。
  2. クラスターが管理対象外になった後に、Web 管理サーバーで carbon-cache サービスを停止します。

    # systemctl stop carbon-cache
    Copy to Clipboard Toggle word wrap
  3. 以下で storage-schemas.conf ファイルにアクセスします。

    /etc/tendrl/monitoring-integration/storage-schemas.conf
    Copy to Clipboard Toggle word wrap
  4. [tendrl] セクションで retentions パラメーターの保持期間を変更し、変更を保存します。

    :

    保持値を 90 日に変更する場合は、Retention s パラメーターに値を設定します。

    [tendrl]
    pattern = ^tendrl\.
    retentions = 60s:90d
    Copy to Clipboard Toggle word wrap

    ここで、

    retentions = 各データポイントは 60 秒を表し、最大 90 日のデータを追加できるよう十分なデータポイントを確保する必要があります。

  5. Web 管理サーバーで carbon-cache サービスを開始します。

    # systemctl start carbon-cache
    Copy to Clipboard Toggle word wrap
  6. クラスターを再度インポートします。手順については、『Red Hat Gluster Storage Web Administration Guide』の「 Import Cluster 」の章を参照してください。

第5章 Web 管理ログレベル

Web Administration では、さまざまなコンポーネントおよびサービスのログメッセージが 10drl-node-agent によってログに記録されます。これは、ソケットを介して他のコンポーネントからすべてのログメッセージを受け取り、syslog を使用してメッセージをログに記録します。

tendrl-node-agent は、以下の Web 管理コンポーネントのメッセージをログに記録します。

サーバー側の Web 管理コンポーネント:

  • tendrl-monitoring-integration
  • tendrl-notifier

ストレージノードサイドの Web 管理コンポーネント:

  • tendrl-gluster-integration

以下は、Web 管理で使用可能なログレベルです。

  1. DEBUG
  2. INFO
  3. 警告
  4. ERROR (デフォルト)
  5. CRITICAL
注記

ログレベルでは大文字と小文字が区別されます。エラーメッセージを回避するために、ログレベルを大文字形式で入力します。

デフォルトのログレベル(ERROR)を変更するには、以下の手順に従います。

  1. エディターでロギング設定 yaml ファイルを開きます。

    /etc/tendrl/node-agent/node-agent_logging.yaml
    Copy to Clipboard Toggle word wrap
  2. ハンドラー および ルート 下のレベル変数のすべてのインスタンスを変更して、ログ レベル を変更します。

    handlers:
        console:
            class: logging.StreamHandler
            level: ERROR 
    1
    
            stream: ext://sys.stdout
    
        info_file_handler:
            class: logging.handlers.SysLogHandler
            facility: local5
            address: /dev/log
            level: ERROR 
    2
    
    
    root:
        level: ERROR 
    3
    
        handlers: [console, info_file_handler]
    Copy to Clipboard Toggle word wrap
    1
    新しいログレベルを入力します。
    2
    新しいログレベルを入力します。
    3
    新しいログレベルを入力します。
  3. 以下を実行して、tendrl-node-agent サービスを再起動します。

    # service tendrl-node-agent restart
    Copy to Clipboard Toggle word wrap

第6章 モニタリングおよびメトリクス

Gluster Web Administration は、Grafana のオープンソース監視プラットフォームを介して、Gluster クラスター、物理サーバーノード、およびストレージ要素(ディスク)のディープメトリックと視覚化を提供します。

第7章 ダッシュボードと概念の監視

Monitoring Dashboard は、クラスター全体のリソースの正常性、パフォーマンス、および使用状況についてのハイレベルの視覚的な情報を提供します。

7.1. ダッシュボードセレクター

Dashboard Selector は、異なるダッシュボード間を移動する主要なナビゲーションツールです。

図7.1 ダッシュボードセレクター

7.2. ダッシュボードパネル

ダッシュボードは、Panels として表現されるさまざまなメトリクスおよび統計を表示する個別の可視化ブロックで構成されます。クラスターコンポーネントの現在のステータスに基づいて、異なるデータを示すパネル。ダッシュボードでは、パネルをドラッグおよび破棄して再編成できます。

以下は、監視データを視覚化するために使用できるパネルのタイプです。

  1. 単一ステータスパネル:ステータスパネルには、シリーズの集約値を 1 つの数字のデータで表示します。たとえば、Health、volume、snapshots は Singlestat パネルです。

    図7.2 単一ステータスパネルの例

  2. 複数のステータスパネル:Multiple status パネルには、データソースの複数の値が表示されます。複数のステータスパネルが表示されます。

    • コンポーネントの重大度
    • コンポーネントが無効の場合
    • コンポーネントに関するパネルの追加データ

      図7.3 複数のステータスパネルの例

      注記

      複数ステータスパネルでコンポーネントのステータスとして Invalid Number と表示される場合、時系列データベースから表示できるデータがないことを示します。

  3. グラフパネル:グラフパネルでは、保存されていないメトリックを視覚化できます。Connection Trend および Throughput Trend は Graph パネルのサンプルです。

    図7.4 グラフパネルの例

  4. テーブルパネル:グラフパネルでは、保存されていないメトリックを視覚化できます。Connection Trend および Throughput Trend は Graph パネルのサンプルです。

図7.5 テーブルパネルの例

7.3. ダッシュボードの行

行は、指定の Dashboard 内の論理ディバイダーです。ダッシュボードのパネルは、見やすくするために、行ごとに編成され、整理されます。

7.4. ダッシュボードの色コード

Dashboard パネルテキストには、以下の色コードが表示され、ヘルスステータスの情報を表示します。

  • :ヘルス
  • オレンジ:Degraded
  • Red Hat:Unhealthy、Down、または Unavailable

第8章 ダッシュボード機能のモニタリング

8.2. ダッシュボードの時間範囲

Grafana インターフェースは、視覚化されるデータの時間範囲管理を提供します。グラフの時間範囲を変更して、異なる時点のデータを表示できます。

右上のマスターダッシュボードのタイムピッカーにアクセスできます。現在選択されている時間範囲と更新間隔が表示されます。

マスターダッシュボードの時間ピッカーをクリックして、メニューを時間範囲コントロールに切り替えます。

時間範囲

時間範囲フィルターでは、明示的な時間範囲と相対時間範囲の両方を組み合わせることができます。明示的な時間範囲形式は YYYY-MM-DD HH:MM:SS です。

クイック範囲

クイック範囲は、相対時間を選択するための事前設定値です。

すべて更新

有効にすると、自動的に更新されると、指定した時間範囲でダッシュボードが再読み込みされます。

8.3. ダッシュボードの共有

Dashboard Selector は、異なるダッシュボード間を移動する主要なナビゲーションツールです。

図8.2 ダッシュボードセレクター

第9章 ダッシュボードのナビゲーションの監視

Monitoring Dashboard にアクセスするには、以下の手順に従います。

  1. http://web-admin-server.example.com で Web 管理インターフェースにログインします。
  2. デフォルトの Cluster ビューで、クラスターを見つけ、Launch Dashboard をクリックします。
  3. 集約されたメトリクスビューが新しいウィンドウで開いている Cluster ダッシュボード。

9.1. クラスタービューダッシュボード

Cluster ビューダッシュボードでは、Gluster Administrator は以下を実行できます。

  • 健全性およびステータス情報、IOPS、スループットなどの主なパフォーマンスインジケーター、クラスター、ホスト、ボリューム、ブリックの潜在的な問題に注目できる Gluster クラスターに関する情報(glance)に関する情報を表示する。
  • クラスター内のホスト全体で IOPS、CPU、メモリー、ネットワーク読み込み などのメトリックを比較します。
  • ボリューム内のブリックの使用状況(IOPS、容量など)を比較します。

図9.1 クラスタービューダッシュボード

9.2. ホストビューダッシュボード

ホストビューダッシュボードでは、Gluster Administrator は以下を実行できます。

  • ホスト、ボリューム、ブリック、ディスクの潜在的な問題に注目する重要なパフォーマンスインジケーター、IOPS、スループットなどを含む Gluster ホストに関する情報、ステータス情報、主要なパフォーマンスインジケーター、およびアラートに関する情報を一見て表示します。
  • ホスト内のブリック間で IOPS、CPU、メモリー、ネットワーク読み込み などのメトリックを 1 つ以上比較します。
  • ホスト内のブリック間で IOPS、容量などの使用率を比較します。

9.3. ボリュームビューダッシュボード

ボリュームビューダッシュボードでは、Gluster Administrator は以下を実行できます。

  • 健全性およびステータス情報を含む Gluster ボリュームに関する一見情報、ボリューム、ブリック、ディスクにおける潜在的な問題に対する注意を強調する主要なパフォーマンスインジケーター。

9.4. ブリックビューダッシュボード

Brick ビューダッシュボードでは、Gluster Administrator は以下を行うことができます。

  • 健全性およびステータス情報、IOPS、スループット、レイテンシーなどの主要なパフォーマンスインジケーター、ブリックおよび基礎となるディスク内の潜在的な問題に注目できる Gluster ブリックに関する情報(glance)に関する情報を表示する。
  • ブリックで、RAID 6 のディスク障害/再構築/破棄のパフォーマンスの診断に対応するブリックでのパフォーマンスを確認します。1 つのブリックでパフォーマンスが低下します。

第10章 クラスターメトリクスのモニタリング

10.1. クラスターレベルのダッシュボード

これは、選択したクラスターの概要を表示する Monitoring インターフェースのデフォルトのダッシュボードです。

10.1.1. クラスターの正常性の監視および表示

Cluster のヘルスステータスとそれに関連するメトリクスを監視するには、Cluster Dashboard でパネルを表示します。パネルの説明およびヘルスインジケーターの詳細は、Table 7.1 を参照してください。Cluster Health Panel Descriptions

10.1.1.1. 健全性およびスナップショット

Health パネルには選択したクラスターの全体的な健全性が表示され、Snapshots パネルにアクティブなスナップショット数が表示されます。

10.1.1.2. ホスト、ボリューム、およびブリック

Hosts、Volumes、および Bricks パネルには、ステータス情報が表示されます。以下は、それぞれのステータス情報を表示する画面の例です。

  • ホスト:合計すると、オンラインホストは 3 つあります。
  • ボリューム:合計すると 9 つのボリュームがあります。
  • ブリック:合計で44 Bricks
10.1.1.3. Geo レプリケーションセッション

Geo-Replication Session パネルには、Geo-Replication セッションの合計数や、ステータス別の geo レプリケーションセッションの数など、指定のクラスターからの Geo レプリケーションセッション情報が表示されます。

10.1.1.4. Health Panel Descriptions

以下の表には、Panels と説明をまとめています。

Expand
表10.1 Cluster Health Panel Descriptions
パネル説明Health Indicator

Health

Health パネルには、選択したクラスターの全体的な健全性が表示されます。これは Healthy または Unhealthyのいずれかです。

緑:ヘルス

Red:Unhealthy

オレンジ:Degraded

スナップショット

Snapshots パネルにアクティブなスナップショットの数が表示されます。

 

ホスト

Hosts パネルには、ホストの合計数やステータス別のホスト数など、ホストのステータス情報が表示されます。

 

ボリューム

Volumes パネルには、ボリュームの合計数およびステータスごとのボリューム数など、選択したクラスターのボリュームステータス情報が表示されます。

 

ブリック

Bricks パネルには、選択したクラスターのブリックステータス情報が表示されます。これには、クラスター内のブリックの合計数と、ステータス別のブリック数が表示されます。

 

Geo レプリケーションセッション

Geo-Replication Session パネルには、geo レプリケーションセッションの合計数やステータス別の Geo レプリケーションセッション数など、特定のクラスターからの Geo レプリケーションセッション情報が表示されます。

 

10.1.2. クラスターパフォーマンスの監視と表示

クラスターパフォーマンスメトリクスは、以下のパネルに表示されるデータでモニタリングできます。

接続の傾向

Connection Trend パネルには、選択したクラスターのブリックへのクライアント接続の合計数が表示されます。標準的な統計は以下のようになります。

IOPS

IOPS パネルには、選択したクラスターの IOPS が一定期間表示されます。IOPS は、gluster ボリュームプロファイル 情報を使用して収集された集約されたブリックレベルの読み取りおよび書き込み操作に基づいています。

容量の使用率および容量が利用可能になる

Capacity Utilization パネルには、選択したクラスターのすべてのボリュームで使用される容量が表示されます。

Capacity Available パネルには、選択したクラスターのすべてのボリュームで利用可能な容量が表示されます。

週次増加率

Weekly Growth Rate パネルには、容量の使用率に基づいて計算された容量の使用率について予測された、週次的な増加率が表示されます。

数週間の残例

Weeks Remaining パネルには、forecasted Weekly Growth Rate に基づいて、週ごとの残りの残りが完全な容量に達する推定時間が表示されます。

スループットのトレンド

Throughput Trend パネルには、一定期間における選択したクラスターのネットワークスループットが表示されます。

10.1.3. 上位コンシューマー

Top Consumers パネルには、クラスターリソースによる最大容量の使用率が表示されます。

クラスターの上位コンシューマーを表示するには、以下を実行します。

  1. Cluster Level ダッシュボードの下部にある Top Consumers をクリックして、メニューを展開します。

ブリックあたりの上位 5 つの使用状況

Top 5 Utilization By Bricks パネルには、容量の使用率が最も高いブリックが表示されます。

ボリューム別の上位 5 利用率

Top 5 Utilization By Volumes パネルには、容量の使用率が最も高いボリュームが表示されます。

ホストごとの CPU 使用率

Host パネルの CPU 使用率には、クラスター内の各ノードの CPU 使用率が表示されます。

ホストごとのメモリー使用量

Hosts パネルの Memory Utilization には、クラスター内の各ノードのメモリー使用率が表示されます。

ping Latency Trend

Ping Latency Trend パネルには、指定のクラスター内の各ホストの ping レイテンシーが表示されます。

10.1.4. クラスターステータスの監視および表示

クラスター全体のステータスを表示するには、以下を実行します。

  1. Cluster Level ダッシュボードの下部にある Status をクリックして、メニューを展開します。

  2. Volume、Host、および Brick のステータスが パネルに表示されます。

ボリュームのステータス

Volume Status パネルには、選択したクラスターの各ボリュームのステータスコードが表示されます。

ボリュームのステータスは numerals および colors に表示されます。以下は、数値の対応するステータスです。

  • 0 = up
  • 3 = up(Degraded)
  • 4 = up(部分的)
  • 5 = unknown
  • 8 = down

ホストのステータス

Host Status パネルには、選択したクラスターの各ホストのステータスコードが表示されます。

ホストのステータスは数字コードで表示されます。

  • 0 = up
  • 8 = down

ブリックステータス

Brick Status パネルには、選択したクラスターの各ブリックのステータスコードが表示されます。

Brick ステータスは数字コードで表示されます。

  • 1 = 開始
  • 10 = 停止

10.2. ホストレベルのダッシュボード

10.2.1. ヘルスおよびステータスの監視および表示

Cluster Hosts のステータスとそれに関連するメトリクスを監視するには、Hosts Level Dashboard に移動し、パネルを表示します。

Health

Health パネルには、指定のホストの全体的な健全性が表示されます。

ブリックとブリックのステータス

Bricks パネルには、ホストの合計ブリック数や、ステータス別のブリック数など、指定ホストのブリックステータス情報が表示されます。

Brick Status パネルには、指定のホストの各ブリックのステータスコードが表示されます。

  • 1 = 開始
  • 10 = 停止

10.2.2. パフォーマンスの監視と表示

10.2.2.1. メモリーおよび CPU 使用率

利用可能なメモリー

Memory Available パネルには、キャッシュされたメモリーとメモリーの合計が表示されます。

メモリー使用率

Memory Utilization パネルには、一定期間にカーネルによって使用されるバッファーおよびキャッシュを含む指定ホストのメモリー使用率の割合が表示されます。

  • バッファー:バッファーに使用されるメモリー量(ほとんどの場合 I/O 操作)
  • キャッシュ済み:読み取り、メモリーマップされたファイル、または tmpfs データのキャッシュに使用するメモリー
  • スラブレッカ:スラブカーネルの割り当てに使用される回収可能なメモリーの量
  • Slab Unrecl:slab カーネルの割り当てに使用される、要求できないメモリーの量
  • 使用 済み:使用されているメモリー量(合計数 - 未使用メモリー)- バッファー付き - キャッシュ
  • 合計:使用済みメモリーの合計

空きスワップ

Swap Free パネルには、指定したホストで利用可能な swap 領域がパーセントで表示されます。

スワップの利用

Swap Utilization パネルには、特定のホストで使用されているスワップ領域をパーセントで表示します。

CPU 使用率

CPU 使用率パネルには、一定期間における指定のホストの CPU 使用率が表示されます。

IOPS

IOPS パネルには、特定のホストの IOPS が一定期間表示されます。 IOPS は集約されたブリックレベルの読み取りおよび書き込み操作に基づいています。

10.2.2.2. 容量およびディスクの読み込み

Brick Capacity Utilization Trend の合計

Total Brick Capacity Utilization Trend パネルには、特定の期間に、指定したすべてのブリックの容量使用量が表示されます。

Brick 容量使用率の合計

Total Brick Capacity Utilization パネルには、指定のホストの現在のパーセント容量の使用率が表示されます。

合計 Brick 容量が利用可能

Total Brick Capacity Available パネルには、特定のホストで利用可能な現在の容量が表示されます。

週次増加率

Weekly Growth Rate パネルには、容量の使用率に基づいて計算された容量の使用率について予測された、週次的な増加率が表示されます。

数週間の残例

Weeks Remaining パネルには、forecasted Weekly Growth Rate を基にしてホスト容量が完全な容量に到達すると予測された時間(Till)が表示されます。

ブリック使用率

Brick Utilization パネルには、特定のホストの各ブリックの使用状況が表示されます。

ブリック容量

Brick Capacity パネルには、指定のホストの各ブリックの合計容量が表示されます。

使用中ブリック容量

Brick Capacity Used パネルには、特定のホストに各ブリックの使用済み容量が表示されます。

ディスクの読み込み

Disk Load パネルには、一定期間におけるディスクの集約された読み取りおよび書き込みが表示されます。

ディスク操作

Disk Operations パネルには、一定期間におけるディスクの集約された読み取り/書き込み操作が表示されます。

ディスク IO

Disk IO パネルには、ホストの集計 I/O 時間が一定期間表示されます。

10.2.2.3. ネットワーク

スループット

Throughput パネルには、特定のホストのネットワークスループットが一定期間表示されます。

1 秒あたりの破棄パケット

Dropped Packets Per Second パネルには、一定期間におけるホストの破棄されたネットワークパケットが表示されます。 通常、破棄されたパケットはネットワークの輻輳を示していることを示します。たとえば、ホストが接続しているスイッチポートのキューは完全で、パケットが破棄されます。これは、十分なデータを送信することができないためです。

1 秒あたりのエラー

Errors Per Second パネルには、特定のホストのネットワークエラーが一定期間表示されます。通常、エラーは伝送者エラー(duplex mismatch, faulty cable)、fifo エラー、ハートビートエラー、およびウィンドウエラー、CRC エラーが短すぎるフレーム、または長いフレームによるパケットの送信中に発生した問題を示しています。つまり、エラーは通常、ハードウェアの障害や速度の不一致により発生します。

10.2.3. ホストダッシュボードのメトリックユニット

次の表は、メトリクスとそれに対応する測定単位を示しています。

Expand
表10.2 ホストダッシュボードのメトリックユニット
メトリクスユニット

利用可能なメモリー

megabyte/Gigabyte/Terabyte

メモリー使用率

パーセント %

空きスワップ

パーセント %

スワップの利用

パーセント %

CPU 使用率

パーセント %

Brick 容量使用率の合計

パーセント %

Brick 容量の合計

MB/GB/TB

週次増加率

MB/GB/TB

ディスクの読み込み

kbps

ディスク IO

ミリ秒(ミリ秒単位)

ネットワークのスループット

kbps

10.3. ボリュームレベルのダッシュボード

Volume ビューダッシュボードでは、Gluster Administrator は以下を実行できます。

  • ボリューム、ブリック、ディスク内の潜在的な問題に注目できる、ヘルス情報およびステータス情報、IOPS、スループットなどの主要なパフォーマンスインジケーター、およびアラートを含む Gluster ボリュームに関する概要情報を表示します。
  • ボリューム内のブリック間で IOPS、CPU、メモリー、ネットワーク負荷 など、1 つ以上のメトリックを比較します。
  • ボリューム内のブリック間で IOPS、容量などの使用率を比較します。
  • パフォーマンスメトリックをブリックで表示(ボリューム内)し、障害の診断、再構築、低下、および 1 つのブリックのパフォーマンスの低下に対応します。

すべての Gluster ストレージノードがシャットダウンまたはオフラインになると、Time to live(TTL)は、秒単位で測定された TTL 値に従ってボリュームの詳細を etcd から削除します。ボリュームの TTL 値は、システム内のボリュームおよびブリックの数に基づいて設定されます。ボリュームの詳細を削除する TTL 値を計算する式は以下のとおりです。

Time to Live(秒)= 同期間隔(60 秒)+ ボリュームの数 * 20 + ブリックの数 * 10 + 160

Web 管理環境では

  • クラスターのステータスが unhealthy と表示され、すべてのホストに down のマークが付けられます。
  • ボリュームとブリックは表示されない
  • Events ビューには関連するステータスが反映されます。

Grafana ダッシュボードで

  • Cluster Level Dashboard では、Host、Volumes、および Bricks パネルで、関連する更新されたカウントがステータスとともに反映されます。
  • Cluster、Volume、および Brick レベルのダッシュボードでは、データがないことを示すパネルに N/A のマークが付けられます。

10.3.1. ヘルスの監視と表示

Health

Health パネルには、指定のボリュームの全体的な健全性が表示されます。

スナップショット

Snapshots パネルには、選択したクラスターのアクティブなスナップショットの数が表示されます。

ブリックステータス

Brick Status パネルには、指定のボリュームの各ブリックのステータスコードが表示されます。

  • 1 = 開始
  • 10 = 停止

ブリック

Bricks パネルには、ボリューム内のブリックの合計数や、ステータス別のブリック数など、指定したボリュームのブリックステータス情報が表示されます。

Subvolumes

Subvolumes パネルには、指定のボリュームのサブボリュームステータス情報が表示されます。

ジオレプリケーションセッション

Geo-Replication Session パネルには、Geo-Replication セッションの合計数や、ステータス別の geo レプリケーションセッションの数など、特定のボリュームからの Geo レプリケーションセッション情報が表示されます。

リバランス

Rebalance パネルには、特定のボリュームのリバランスの進捗情報が表示されます。これは、リバランスの進行中に適用されます。

リバランスステータス:

Rebalance Status パネルには、指定のボリュームのリバランスの状態が表示されます。

10.3.2. パフォーマンスの監視と表示

容量の使用率

Capacity Utilization パネルには、指定のボリュームで使用された容量が表示されます。

利用可能な容量

Capacity Available パネルには、指定のボリュームで利用可能な容量が表示されます。

週次増加率

Weekly Growth Rate パネルには、容量の使用率に基づいて計算された容量の使用率について予測された、週次的な増加率が表示されます。

数週間の残例

Weeks Remaining パネルには、forecasted Weekly Growth Rate に基づいて、週ごとの残りの残りが完全な容量に到達する推定時間が表示されます。

容量の使用率の傾向

Capacity Utilization Trend パネルには、一定期間におけるボリューム容量の使用率が表示されます。

inode の使用率

Inode Utilization パネルには、ボリュームのブリックに使用される inode が一定期間表示されます。

利用可能な inode

Inode Available パネルには、ボリュームのブリックに free の inodes free が表示されます。

スループット

Throughput パネルには、gluster ボリューム プロファイルを使用してフェッチされたブリックレベルの読み取りおよび書き込み操作に基づくボリューム のスループットが表示されます。

LVM シンプールメタデータ %

LVM Thin Pool Metadata % パネルには、特定のボリュームに LVM シンプールメタデータの使用率が表示されます。LVM シンプールメタデータとデータの使用状況を監視することは、容量が不足しないようにすることが重要です。データ領域が使い切られると、I/O 操作は設定に基づいてキューに入れられるか、または失敗します。メタデータ領域が使い切られると、LVM プールがオフラインになり、潜在的な不整合を修正するために修復が実行されるまで、I/O というエラーが表示されます。さらに、メタデータトランザクションが中断され、キャッシュを行うプールにより、上位のストレージ層(ファイルシステム)に対して確認された(ディスクへの)コミットされていない(ディスクへの)I/O 操作もあるため、これらのレイヤーにもチェック/修復が必要になります。

LVM シンプールデータ使用量 %

LVM Thin Pool Data Usage % パネルには、指定のボリュームの LVM シンプールデータ使用量が表示されます。LVM シンプールメタデータとデータの使用状況を監視することは、容量が不足しないようにすることが重要です。データ領域が使い切られると、I/O 操作は設定に基づいてキューに入れられるか、または失敗します。メタデータ領域が使い切られると、LVM プールがオフラインになり、潜在的な不整合を修正するために修復が実行されるまで、I/O というエラーが表示されます。さらに、メタデータトランザクションが中断され、キャッシュを行うプールにより、上位のストレージ層(ファイルシステム)に対して確認された(ディスクへの)コミットされていない(ディスクへの)I/O 操作もあるため、これらのレイヤーにもチェック/修復が必要になります。

10.3.3. ファイル操作の監視

上位ファイル操作

Top File Operations パネルには、%のレイテンシーが最も高い上位 5 FOP(ファイル操作)が表示されます。%のレイテンシーは、FOP が使用する FOP 応答時間の一部になります。

トレンドをロックするファイル操作

File Operations for Locks Trend パネルには、一定期間におけるロックについての平均レイテンシー、最大レイテンシー、および FOP ごとに呼び出し率が表示されます。

読み取り/書き込みのファイル操作

File Operations for Read/Write パネルには、一定期間における読み取り/書き込み操作の平均レイテンシー、最大レイテンシー、呼び出し率が表示されます。

Inode 操作のファイル操作

Inode Operations の File Operations パネルには、Inode 操作の平均レイテンシー、最大レイテンシー、呼び出し率が表示されます。

エントリー操作のファイル操作

File Operations for Entry Operations パネルには、一定期間におけるエントリー操作の平均レイテンシー、最大レイテンシー、呼び出し率が表示されます。

10.3.4. ボリュームダッシュボードの単位

次の表は、メトリクスとそれに対応する測定単位を示しています。

Expand
表10.3 ボリュームダッシュボードの単位
メトリクスユニット

容量の使用率

パーセント %

利用可能な容量

megabyte/Gigabyte/Terabyte

週次増加率

megabyte/Gigabyte/Terabyte

容量の使用率の傾向

パーセント %

inode の使用率

パーセント %

LVM シンプールメタデータ

パーセント %

LVM シンプールデータの使用

パーセント %

トレンドをロックするファイル操作

MB/GB/TB

読み取り/書き込みのファイル操作

K

Inode 操作傾向のファイル操作

K

エントリー操作のファイル操作

K

10.4. ブリックレベルのダッシュボード

10.4.1. 監視とブリックのステータス表示

Status パネルには、指定のブリックのステータスが表示されます。

10.4.2. ブリックのパフォーマンスの監視と表示

容量の使用率

Capacity Utilization パネルには、指定のブリックの容量使用率の割合が表示されます。

利用可能な容量

Capacity Available パネルには、指定のボリュームで利用可能な容量が表示されます。

容量の使用率の傾向

Capacity Utilization Trend パネルには、一定期間におけるブリック容量の使用率が表示されます。

週次増加率

Weekly Growth Rate パネルには、容量の使用率に基づいて計算された容量の使用率について予測された、週次的な増加率が表示されます。

数週間の残例

Weeks Remaining パネルには、forecasted Weekly Growth Rate を基にして、数週間単位のブリックがフル容量に到達する推定時間が表示されます。

回復

healing パネルには、healinfo に基づいて指定のボリュームの回復情報が表示されます。

注記

Healing パネルには、レプリカのないボリュームのデータは表示されません。

IOPS

IOPS パネルには、一定期間におけるブリックの IOPS が表示されます。IOPS は、ブリックレベルの読み取りおよび書き込み操作に基づいています。

LVM シンプールメタデータ %

LVM Thin Pool Metadata % パネルには、指定されたブリックで LVM シンプールメタデータの使用率が表示されます。LVM シンプールメタデータとデータの使用状況を監視することは、容量が不足しないようにすることが重要です。データ領域が使い切られると、I/O 操作は設定に基づいてキューに入れられるか、または失敗します。メタデータ領域が使い切られると、LVM プールがオフラインになり、潜在的な不整合を修正するために修復が実行されるまで、I/O というエラーが表示されます。さらに、メタデータトランザクションが中断され、キャッシュを行うプールにより、上位のストレージ層(ファイルシステム)に対して確認された(ディスクへの)コミットされていない(ディスクへの)I/O 操作もあるため、これらのレイヤーにもチェック/修復が必要になります。

LVM シンプールデータ使用量 %

LVM Thin Pool Data Usage % パネルに、指定されたブリックの LVM シンプールデータ使用状況が表示されます。LVM シンプールメタデータとデータの使用状況を監視することは、容量が不足しないようにすることが重要です。データ領域が使い切られると、I/O 操作は設定に基づいてキューに入れられるか、または失敗します。メタデータ領域が使い切られると、LVM プールがオフラインになり、潜在的な不整合を修正するために修復が実行されるまで、I/O というエラーが表示されます。さらに、メタデータトランザクションが中断され、キャッシュを行うプールにより、上位のストレージ層(ファイルシステム)に対して確認された(ディスクへの)コミットされていない(ディスクへの)I/O 操作もあるため、これらのレイヤーも修復する必要があります。

スループット

Throughput パネルには、「gluster volume profile」を使用してフェッチされたブリックレベルの読み取りおよび書き込み操作が表示されます。

latency

Latency パネルには、一定期間におけるブリックのレイテンシーが表示されます。 レイテンシーは、ブリックが読み取りまたは書き込み操作を行うのに費やした平均時間に基づきます。

10.4.3. ブリックダッシュボードメトリックユニット

次の表は、メトリクスとそれに対応する測定単位を示しています。

Expand
表10.4 ブリックダッシュボードメトリックユニット
メトリクスユニット

容量の使用率

パーセント %

利用可能な容量

megabyte/Gigabyte/Terabyte

週次増加率

megabyte/Gigabyte/Terabyte

容量の使用率の傾向

パーセント %

inode の使用率

パーセント %

LVM シンプールメタデータ

パーセント %

LVM シンプールデータの使用

パーセント %

ディスクスループット

パーセント %

第11章 ユーザーとロールの管理

11.1. ユーザーロール

Web 管理に使用できるユーザーロールは 3 つあります。

  1. 管理:Admin ロールは、すべての Web 管理操作を管理するユーザーに対し、完全な権限を付与します。
  2. 通常のユーザー:Normal User ロールは、クラスターのインポートやボリュームのプロファイリングの有効化や無効化などの操作を実行できますが、ユーザーおよび他の管理操作の管理を制限します。
  3. 読み取り専用ユーザー:読み取り専用:Read-only User ロールは、クラスター全体のメトリクスと読み取り可能なデータのみを表示および監視するためにユーザーに承認します。ユーザーは Web 管理インターフェースから Grafana ダッシュボードを起動できますが、ストレージ操作を実行するように制限されます。このロールは、モニタリングタスクを実行するユーザーに適しています。

11.2. ロールの設定

新しいユーザーを追加および設定するには、以下の手順に従います。

  1. Web 管理インターフェースにログインし、ナビゲーションペインで 管理 > ユーザー をクリックします。
  2. ユーザーリストが表示されます。新しいユーザーを追加するには、右側の Add をクリックします。

  3. 指定のフィールドにユーザー情報を入力します。メール通知を有効または無効にするには、ON-OFF ボタンを切り替えます。

  4. 利用可能な 3 つのロールから Role を選択し、Save をクリックします。

  5. 新しいユーザーが正常に作成されます。

11.2.1. ユーザーの編集

既存ユーザーを編集するには、以下を実行します。

  1. インターフェースナビゲーションから Admin > Users をクリックして、ユーザービューに移動します。
  2. 編集するユーザーを見つけ、右側の Edit をクリックします。

  3. 必要な情報を編集し、Save をクリックします。

11.2.2. 通知の無効化とユーザーの削除

通知の有効化および無効化

通知を有効にするには、以下を実行します。

  1. インターフェースナビゲーションから Admin > Users をクリックして、ユーザービューに移動します。

  2. Edit ボタンの横にある垂直のヒントをクリックし、呼び出しメニューから Disable Email Notification をクリックします。

  3. ユーザーのメール通知が無効になっています。

ユーザーの削除

既存ユーザーを削除するには、以下を実行します。

  1. インターフェースナビゲーションから Admin > Users をクリックして、ユーザービューに移動します。
  2. 削除するユーザーを見つけ、編集 ボタンの横にある垂直のヒントをクリックします。呼び出しメニューが開き、Delete User をクリックします。

  3. 確認ボックスが表示されます。削除 をクリックします。

第12章 アラートおよび通知

アラートは、システムで発生する現在の問題および重要な状態であり、ユーザーに通知されます。Grafana モニタリングプラットフォームは、重大度レベルに基づいてアラートを生成します。

SMTP プロトコルおよび SNMP プロトコルを介してアラートを設定できます。SMTP 設定は、メール通知が有効になっているユーザーに電子メールアラートを送信します。SNMPv3 設定は、Web 管理環境のアラート通知ドロワーに SNMP トラップアラートを送信します。

12.1. アラートの種類

Dashboard によってトリガーされるアラートは、以下のカテゴリーに分類されます。

  • ステータスアラート:クラスターリソースの状態が変わる際に発生するアラートです。たとえば、Healthy は Unhealthy です。
  • 使用率アラート:クラスターリソースがセットしきい値を超えた後に発生するアラートであり、通常の状態に戻ります。たとえば、Host CPU 使用率が違反されると、アラートがトリガーされ、イベントについてユーザーに通知します。

12.2. アラートの一覧

Web 管理アラートのリストは以下の表に記載されています。

Status アラート

Expand
表12.1 Status アラート
アラートシステムリソース

ボリュームのステータス

ボリュームとクラスター

ボリュームの状態

ボリュームとクラスター

ブリックステータス

ボリューム、ホスト、およびクラスター

ピアステータス

クラスター

リバランスステータス

ボリュームとクラスター

Geo レプリケーションのステータス

クラスター

失われたボリュームのクォーラム

ボリュームとクラスター

ボリュームの再取得(定足数)

ボリュームとクラスター

svc が接続されている

クラスター

svc disconnected

クラスター

EC サブボリュームにないブリックの最小数

ボリュームとクラスター

EC サブボリュームにあるブリックの最小数

ボリュームとクラスター

サブボリュームのクラスタークォーラム(定足数)

ボリュームとクラスター

サブボリュームの afr quorum fail

ボリュームとクラスター

afr サブボリューム

ボリュームとクラスター

afr サブボリュームダウン

ボリュームとクラスター

使用状況アラート

Expand
表12.2 使用状況アラート
アラートシステムリソース

CPU 使用率

ホスト

メモリー使用率

host

スワップ使用率

host

ボリュームの使用状況

ボリュームとクラスター

ブリックの使用率

ボリュームとクラスター

12.3. アラート通知ドロワー

アラートドロワーは、Web 管理インターフェースに組み込まれた通知インジケーターで、システム全体のアラートを表示します。

アラートドロワーへのアクセス

  1. Alerts ドロワーにアクセスするには、Web 管理インターフェースにログインします。デフォルトのランディングインターフェースで、右上のヘッダーバーにある対話式ベルアイコンを探してクリックします。

  2. デクロワーが開き、生成されたアラートの数が表示されます。

アラートをフィルタリングするには、右側のステータスアイコンをクリックします。

12.4. SMTP 通知の設定

Tendrl-ansible は、10 個のdrl-notifier をインストールし、設定します。10drl-notifier ファイルを設定したら、SMTP のメール通知を設定します。

  1. /etc/tendrl/notifier/email.conf.yaml ファイルを開きます。
  2. パラメーターを更新します。

    email_id = <The sender email id>
    
    email_smtp_server = <The smtp server>
    
    email_smtp_port = <The smtp port>
    Copy to Clipboard Toggle word wrap
  3. SMTP サーバーが認証されたメールのみに対応している場合は、/etc/tendrl/notifier/email_auth.conf.yaml ファイルのテンプレートに従い、以下を有効にします。

        auth = <ssl/tls>
    
        email_pass = <password corresponding to email_id for authenticating to smtp server>
    Copy to Clipboard Toggle word wrap
  4. 10drl-notifier サービスを再起動します。

    systemctl restart tendrl-notifier
    Copy to Clipboard Toggle word wrap

12.5. SNMPv3 通知の設定

SNMP の設定

Tendrl-ansible は、10 個のdrl-notifier をインストールし、設定します。10drl-notifier ファイルを設定したら、SNMPv3 トラップ通知を設定します。

  1. 10drl-notifier 設定ファイルを開きます。

    # cat /etc/tendrl/notifier/snmp.conf.yaml
    Copy to Clipboard Toggle word wrap
  2. v3 トラップアラートのファイルでパラメーターを更新します。

    For v3_endpoint:
    # For more hosts you can add more entry with endpoint2, endpoint3, etc
    endpoint1:
    
    # Name or IP address of the remote SNMP host.
            host_ip: <Receiving machine ip>
    # Name of the user on the host that connects to the agent.
            username: <Username of receiver>
    # Enables the agent to receive packets from the host.
            auth_key: <md5 password>
    # The private user password
            priv_key: <des password>
    
    
    # For v2_endpoint:
    
    # For more hosts you can add more entry with endpoint2, endpoint3, etc
    
    endpoint1:
    # Name or IP address of the remote SNMP host.
         host_ip: <Receiving machine ip>
         community: <community name>
    Copy to Clipboard Toggle word wrap
  3. 10drl-notifier サービスを再起動します。

    systemctl restart tendrl-notifier
    Copy to Clipboard Toggle word wrap
トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2026 Red Hat