2.13. Ceph のリバランスおよびリカバリー
管理者が Ceph OSD を Ceph Storage クラスターに追加する際に、Ceph はクラスターマップを更新します。変更されたクラスターマップは CRUSH 計算の入力を変更するため、クラスターマップへのこの変更は、オブジェクトの配置も変更します。CRUSH はデータを均等に配置しますが、疑似ランダムに配置します。そのため、管理者が新しい OSD を追加すると、移動するデータはごくわずかになります。データの量は通常、新しい OSD の数をクラスター内のデータの合計量で割ったものになります。たとえば、50 個の OSD があるクラスターでは、OSD を追加すると、データの 1/50 または 2% が移動する可能性があります。
次の図は、すべてではなく一部の PG が図にある既存の OSD である OSD 1 および 2 から、新しい OSD である OSD 3 に移行するリバランスプロセスを示しています。リバランスを行う場合でも、CRUSH は安定しています。配置グループの多くは元の設定のままであり、各 OSD には容量が追加されるため、クラスターのリバランス後に新しい OSD に負荷が急増することはありません。
Ceph には 2 種類のバランサーがあります。
容量のバランス:
容量のバランスは機能上の必要性です。1 つのデバイスがいっぱいになると、システムは書き込みリクエストを受け入れることができなくなります。デバイスがいっぱいになるのを回避するには、デバイス間で容量のバランスを公平に保つことが重要です。すべてのデバイスが同じ満杯レベルになるように、各デバイスはそのサイズに比例した容量を取得する必要があります。容量バランシングにより、パフォーマンスの観点から、書き込みリクエストに対して OSD 上に公平なワークロードが作成されます。
容量のバランスをとるにはデータの移動が必要ですが、システムのバランスをとるのに時間がかかるため、時間のかかる操作です。
書き込みパフォーマンスを最適化するには、すべてのデバイスが均一であること (サイズとパフォーマンスが同じであること) を確認してください。
読み取り分散: [テクノロジープレビュー]
重要テクノロジープレビュー機能は、実稼働環境での Red Hat サービスレベルアグリーメント (SLA) ではサポートされておらず、機能的に完全ではない可能性があるため、Red Hat では実稼働環境での使用を推奨していません。テクノロジープレビューの機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行いフィードバックを提供していただくことを目的としています。詳細は、「Red Hat テクノロジープレビュー機能のサポート範囲」を参照してください。
読み取り分散はパフォーマンスの必要性です。これにより、各デバイスがプライマリー OSD を公平に共有できるようになり、読み取りリクエストがクラスター内の OSD 全体に均等に分散されるようになり、システムのパフォーマンスが向上します。不均衡な読み取りリクエストは、チェーン効果で最も弱いリンクが発生し、クラスターの読み取り帯域幅が減少するため、負荷がかかるとパフォーマンスが低下します。読み取り分散は低コストで、データの移動が含まれないため操作が高速です。これはメタデータ操作であり、osdmap が更新されて、pg 内のどの OSD がプライマリーになるかを変更します。
読み取り分散は Replicated プールのみをサポートし、Erasure Code プールはサポートされません。読み取り分散では、OSD のデバイスクラスと DR ソリューションのアベイラビリティゾーンは考慮されません。読み取り分散機能を使用するにはオフラインツールを使用できますが、クラスターの各プールで手順を実行する必要があります。自動スケールを変更するたびに、読み取り分散手順を再度実行する必要があります。
最適な読み取りパフォーマンスを得るには、すべてのデバイスが均一 (サイズとパフォーマンスが同じ) であり、容量のバランスが取れていることを確認してください。