第3章 ネットワーク問題のトラブルシューティング
本章では、ネットワークとネットワークタイムプロトコル (NTP) に関する基本的なトラブルシューティングの手順を説明します。
3.1. 基本的なネットワーク問題のトラブルシューティング
Red Hat Ceph Storage は、信頼性のあるネットワーク接続に大きく依存しています。Ceph ノードは、ネットワークを使用して相互に通信します。ネットワークに問題があると、OSD フラッピングや OSD が間違って down
とレポートされるなどの OSD に関する多くの問題が発生しかねません。ネットワーク問題は、モニターの clock skew
エラーも引き起こします。また、パケット損失や高レイテンシー、帯域幅が制限される場合には、クラスターのパフォーマンスと安定性に影響が出ます。
手順: 基本的なネットワーク問題のトラブルシューティング
-
Ceph 設定ファイルの
cluster_network
とpublic_network
のパラメーターに適切な値が含まれているか確認します。 - ネットワークインターフェイスが起動していることを確認します。詳細については、カスタマーポータルの Basic Network troubleshooting を参照してください。
- Ceph のノードが短いホスト名を使って相互に接続できることを確認します。Red Hat Ceph Storage 2 の Installation Guide for Red Hat Enterprise Linux または Installation Guide for Ubuntu の Setting DNS Name Resolution セクションを参照してください。
- ファイアウォールを使用する場合は、Ceph のノードが適切なポートで相互に接続できることを確認します。Red Hat Ceph Storage 2 の Installation Guide for Red Hat Enterprise Linux または Installation Guide for Ubuntu の Configuring Firewall セクションを参照してください。
- インターフェイスカウンターにエラーがないこと、ホスト間の接続のレイテンシーが期待値内であること、パケット損失が無いことを確認します。詳細はカスタマーポータルの "ethtool" コマンドは何ですか? このコマンドを使用して、ネットワークデバイスおよびインターフェイスの情報を取得する方法は? と rx_fw_discards が原因でシステムがパケットを落とします のソリューションを参照してください。
-
パフォーマンスに問題がある場合は、レイテンシーの確認のほかに、
iperf
ユーティリティーを使用してクラスターの全ノード間のネットワーク帯域幅を確認します。詳細はカスタマーポータルの What are the performance benchmarking tools available for Red Hat Ceph Storage? のソリューションを参照してください。 - 全ホストのネットワーク相互接続スピードが同じであることを確認してください。これが違うと、遅いノードが速いノードを遅らせる可能性があります。また、スイッチ間リンクが接続されているノードの集計帯域幅を処理できることを確認します。
その他の参照先
- Red Hat Enterprise Linux 7 ネットワークガイド
- カスタマーポータルにあるネットワーク問題のトラブルシュートに関連する 記事およびソリューション
3.2. 基本的な NTP 問題のトラブルシューティング
本セクションでは、基本的な NTP 問題のトラブルシュートの手順を説明します。
手順: 基本的な NTP 問題のトラブルシューティング
ntpd
デーモンがモニターホストで稼働していることを確認します。# systemctl status ntpd
ntpd
が稼働していない場合は、これを有効にして開始します。# systemctl enable ntpd # systemctl start ntpd
ntpd
がクロックを正常に同期していることを確認します。$ ntpq -p
- 高度な NTP トラブルシュートの手順については、カスタマーポータルにある NTP 問題のトラブルシューティング のソリューションを参照してください。