第9章 ネットワーク可観測性アラート
Network Observability Operator は、組み込みのメトリクスと OpenShift Container Platform モニタリングスタックを使用してアラートを提供し、クラスターのネットワークの正常性を迅速に示します。
ネットワーク可観測性アラートは、テクノロジープレビュー機能のみです。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
9.1. ネットワーク可観測性アラートについて リンクのコピーリンクがクリップボードにコピーされました!
ネットワーク可観測性には、事前定義されたアラートが含まれます。これらのアラートを使用して、OpenShift Container Platform アプリケーションおよびインフラストラクチャーの正常性とパフォーマンスに関する洞察を得ることができます。
事前定義されたアラートは、Network Health ダッシュボードでのクラスターのネットワークに関する迅速なヘルス表示を提供します。Prometheus Query Language (PromQL)クエリーを使用してアラートをカスタマイズすることもできます。
デフォルトでは、ネットワークの可観測性は有効にした機能のコンテキストとなるアラートを作成します。
たとえば、パケットドロップ関連のアラートは、FlowCollector カスタムリソース(CR)で PacketDrop エージェント機能が有効になっている場合にのみ作成されます。アラートはメトリクスでビルドされ、有効なアラートに必要なメトリクスが欠落している場合、設定警告が表示される可能性があります。
これらのメトリクスは、FlowCollector CR の spec.processor.metrics.includeList オブジェクトで設定できます。
9.1.1. デフォルトのアラートテンプレート一覧 リンクのコピーリンクがクリップボードにコピーされました!
これらのアラートテンプレートは、デフォルトでインストールされます。
PacketDropsByDevice-
デバイスからのパケットドロップの高いパーセンテージでトリガーされます(
/proc/net/dev)。 PacketDropsByKernel-
カーネルによってパケットドロップの高い割合でトリガーされます。
PacketDropエージェント機能が必要です。 IPsecErrors-
IPsec 暗号化エラーがネットワークの可観測性によって検出される際にトリガーされます。
IPSecエージェント機能が必要です。 NetpolDenied-
ネットワークポリシーによって拒否されたトラフィックがネットワークの可観測性によって検出されるとトリガーされます。
NetworkEventsエージェント機能が必要です。 LatencyHighTrend-
ネットワークの可観測性によって TCP レイテンシーの増加が検出されたときにトリガーされます。
FlowRTTエージェント機能が必要です。 DNSErrors-
DNS エラーがネットワークの可観測性によって検出される際にトリガーされます。
DNSTrackingエージェント機能が必要です。
これらは、ネットワークの可観測性の自己健全性に関連する運用上のアラートです。
NetObservNoFlows- 一定期間フローが観察されない場合にトリガーされます。
NetObservLokiError- Loki エラーが原因でフローが削除されたときにトリガー。
ネットワークの可観測性のアラートを設定、拡張、または無効にできます。次のコマンドを実行して、結果の PrometheusRule リソースをデフォルトの netobserv namespace で表示できます。
oc get prometheusrules -n netobserv -oyaml
$ oc get prometheusrules -n netobserv -oyaml
9.1.2. ネットワークヘルスダッシュボード リンクのコピーリンクがクリップボードにコピーされました!
Network Observability Operator でアラートを有効にすると、次の 2 つのことが発生します。
-
新しいアラートは、OpenShift Container Platform Web コンソールの Observe
Alerting Alerting rules タブに表示されます。 -
OpenShift Container Platform Web コンソール
Observe に新しい Network Health ダッシュボードが表示されます。
Network Health ダッシュボードでは、トリガーされたアラートと保留中のアラートの概要を提供し、重大、警告、およびマイナーな問題を区別します。交通違反のアラートは、以下のタブに表示されます。
- グローバル: クラスターにグローバルとなるアラートを表示します。
- Nodes: ノードごとの交通違反のアラートを表示します。
- Namespace: namespace ごとの交通違反のアラートを表示します。
リソースカードをクリックすると、詳細が表示されます。各アラートの横には、3 つの点メニューが表示されます。このメニューから、Network Traffic