第9章 Network Observability アラート
Network Observability Operator は、組み込みのメトリクスと OpenShift Container Platform モニタリングスタックを使用してアラートを提供し、クラスターのネットワークの健全性を迅速に示します。
Network Observability アラートは、テクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
9.1. Network Observability アラートについて リンクのコピーリンクがクリップボードにコピーされました!
Network Observability には、事前定義済みのアラートがあります。これらのアラートを使用して、OpenShift Container Platform アプリケーションとインフラストラクチャーの健全性とパフォーマンスに関する詳細情報を得ることができます。
事前定義済みのアラートにより、Network Health ダッシュボードに、クラスターのネットワークの健全性状態がすぐに表示されます。Prometheus Query Language (PromQL) クエリーを使用してアラートをカスタマイズすることもできます。
デフォルトでは、Network Observability により、有効にした機能に応じたアラートが作成されます。
たとえば、パケットドロップ関連のアラートは、FlowCollector カスタムリソース (CR) で PacketDrop エージェント機能が有効になっている場合にのみ作成されます。アラートはメトリクスに基づいて作成されるため、有効なアラートに必要なメトリクスが不足している場合、設定に関する警告が表示されることがあります。
これらのメトリクスは、FlowCollector CR の spec.processor.metrics.includeList オブジェクトで設定できます。
9.1.1. デフォルトのアラートテンプレートのリスト リンクのコピーリンクがクリップボードにコピーされました!
次のアラートテンプレートはデフォルトでインストールされます。
PacketDropsByDevice-
デバイス (
/proc/net/dev) からのパケットドロップ率が高い場合にトリガーされます。 PacketDropsByKernel-
カーネルによるパケットドロップ率が高い場合にトリガーされます。
PacketDropエージェント機能が必要です。 IPsecErrors-
Network Observability によって IPsec 暗号化エラーが検出されるとトリガーされます。
IPSecエージェント機能が必要です。 NetpolDenied-
ネットワークポリシーによって拒否されたトラフィックが Network Observability によって検出されるとトリガーされます。
NetworkEventsエージェント機能が必要です。 LatencyHighTrend-
Network Observability によって TCP レイテンシーの増加が検出されるとトリガーされます。
FlowRTTエージェント機能が必要です。 DNSErrors-
Network Observability によって DNS エラーが検出されるとトリガーされます。
DNSTrackingエージェント機能が必要です。
以下は、Network Observability 自体の健全性に関連する運用アラートです。
NetObservNoFlows- 一定期間フローが観測されない場合にトリガーされます。
NetObservLokiError- Loki エラーによりフローがドロップされたときにトリガーされます。
Network Observability のアラートは、設定、拡張、または無効にできます。次のコマンドを実行すると、デフォルトの netobserv namespace に生成された PrometheusRule リソースを表示できます。
$ oc get prometheusrules -n netobserv -oyaml
9.1.2. Network Health ダッシュボード リンクのコピーリンクがクリップボードにコピーされました!
Network Observability Operator でアラートが有効な場合、次の 2 つのものが表示されます。
-
新しいアラートが、OpenShift Container Platform Web コンソールの Observe
Alerting Alerting rules タブに表示されます。 -
新しい Network Health ダッシュボードが、OpenShift Container Platform Web コンソール
Observe に表示されます。
Network Health ダッシュボードは、トリガーされたアラートと保留中のアラートの概要を提供し、重大な問題、警告、および軽微な問題に分類します。ルール違反に関するアラートは次のタブに表示されます。
- Global: クラスター全体に対するアラートを表示します。
- Nodes: ノードごとにルール違反に関するアラートを表示します。
- Namespaces: namespace ごとにルール違反に関するアラートを表示します。
リソースカードをクリックすると詳細情報が表示されます。各アラートの横に、省略記号メニューが表示されます。このメニューから、Network Traffic