3.6. RADOS
ネットワークパフォーマンスを追跡するために ping 時間を使用するように更新します。
以前は、ネットワークの問題が発生しても、他のパフォーマンスの問題と区別することは容易ではありませんでした。今回のリリースで、平均の Red Hat Ceph Storage OSD ハートビートが計算された間隔の設定可能なしきい値を超えると、ヘルス警告が生成されます。Red Hat Ceph Storage OSD は、平均値、最小値、最大値で 1 分、5 分、15 分間隔の計算を行います。
Dashboard に追加された BlueStore 圧縮統計
今回のリリースにより、BlueStore OSD の圧縮に関連するパフォーマンスメトリックがダッシュボードに表示されるようになりました。
ダッシュボードの詳細は、ダッシュボードガイド を参照してください。
Ceph OSD で I/O エラーが発生した場合にストレージクラスターのステータスが変わります。
今回のリリースにより、Ceph Monitor に mon_osd_warn_num_repaired
オプションが追加されました。これは、デフォルトで 10
に設定されています。いずれかの Ceph OSD が保存データの I/O エラーをこれ以上修復した場合は、OSD_TOO_MANY_REPAIRS
のヘルス警告ステータスが生成されます。この警告をクリアするために、新しい clear_shards_repaired
オプションが ceph tell
コマンドに追加されました。以下に例を示します。
ceph tell osd.NUMBER clear_shards_repaired [COUNT]
clear_shards_repaired
オプションはデフォルトで、修復数を 0
に設定します。追加の Ceph OSD 修復が実行された場合に再度警告を行うには、mon_osd_warn_num_repaired
オプションの値を指定できます。
ハートビート猶予期間への更新
以前のリリースでは、Ceph OSD の障害が 48 時間以上なかった場合に、猶予タイマーをデフォルト値に戻すメカニズムがありませんでした。今回のリリースにより、Ceph OSD で 48 時間の間に障害が発生した場合は、ハートビート猶予タイマーがデフォルト値の 20 秒にリセットされるようになりました。最後の失敗と、最新の障害間の障害の間隔が 48 時間を超えると、猶予タイマーはデフォルト値の 20 秒にリセットされます。
猶予時間は、Ceph ストレージクラスターがハートビートがないことで Ceph OSD がダウンしたとみなす間隔です。猶予時間は、ラグの推定、または Ceph ODS の障害発生頻度に基づいてスケーリングされます。
osd_client_message_cap
オプションが追加
以前のリリースでは、osd_client_message_cap
オプションが削除されましたが、本リリースでは osd_client_message_cap
オプションが再導入されました。このオプションは、これらのリクエストをスロットリングして、インフライトクライアント要求の最大数を制御するのに役立ちます。これは、クライアントベースのトラフィックが圧倒的に多いために Ceph OSD がフラップする場合に役立ちます。