第4章 Ceph Storage のストレッチクラスター


ストレージ管理者は、Ceph でストレッチモードを有効にして、2 サイトのストレッチクラスターを設定できます。

Red Hat Ceph Storage システムでは、障害ドメインを OSD レベルを超えてデータセンターまたはクラウドゾーンレベルに拡張するオプションが提供されます。

次の図は、tiebreaker ホストがデータセンター (DC) 3 にプロビジョニングされている、ストレッチモードで動作する Ceph クラスターを簡略化して表現しています。

図4.1 Ceph Storage のストレッチクラスター

ストレッチクラスターは、ローカルエリアネットワーク (LAN) 上で動作する一般的な Ceph クラスターとは異なり、ワイドエリアネットワーク (WAN) 上で動作します。例として提示する目的で、データセンターが障害ドメインとして選択されていますが、これはクラウドアベイラビリティーゾーンを指す場合もあります。データセンター 1 (DC1) とデータセンター 2 (DC2) にはそれぞれのドメイン内に OSD とモニターが含まれていますが、データセンター 3 (DC3) には 1 つのモニターのみが含まれています。DC1 と DC2 間のレイテンシーは 10 ミリ秒 RTT を超えてはなりません。レイテンシーが大きいと、レプリケーション、リカバリー、および関連操作に関して Ceph のパフォーマンスに大きな影響を与える可能性があります。ただし、通常は仮想マシン上にホストされる非データサイトである DC3 は、他の 2 つのデータサイトと比べて、レイテンシーが高くても許容できます。図のようなストレッチクラスターは、少なくとも 2 つのサイトが接続されたままである限り、データセンター全体の障害やデータセンター間のネットワーク分割に耐えることができます。

図のようなストレッチクラスターは、少なくとも 2 つのサイトが接続されたままである限り、データセンター全体の障害やデータセンター間のネットワーク分割に耐えることができます。

注記

ストレッチクラスターの電源を切るために追加の手順はありません。詳細は、Red Hat Ceph Storage クラスターの電源切断と再起動 を参照してください。

4.1. ストレージクラスターのストレッチモード

ストレッチクラスター (地理的に分散されたデプロイメント) の可用性を向上させるには、ストレッチモードにする必要があります。ストレッチモードが有効になっている場合、Ceph OSD は、配置グループ (PG) がデータセンター間でピア接続している場合、または指定した他の CRUSH バケットタイプが両方ともアクティブであると仮定して、PG のみをアクティブと見なします。プールのサイズはデフォルトの 3 から 4 に増加し、各サイトに 2 つのコピーがあります。

ストレッチモードでは、Ceph OSD は同じデータセンター内のモニターのみに接続できます。新しいモニターは、場所を指定しないと、クラスターに参加できません。

データセンターのすべての OSD とモニターが一度にアクセスできなくなった場合、存続しているデータセンターは degraded ストレッチモードに入ります。これにより、警告が発行され、min_size が 1 に減少し、クラスターが残りのサイトからのデータで active 状態に到達できるようになります。

ストレッチモードは、2 つのデータセンター間のネットワーク分断 (netsplit) シナリオと 1 つのデータセンターの損失を処理するように設計されています。ストレッチモードは、ネットワーク分断 (netsplit) 発生時に、tiebreaker モニターとの接続性がより良い側の生存データセンターを選択することで対応します。ストレッチモードでは、すべてのプールの min_size を 1 に減らすことで 1 つのデータセンターの損失に対処し、クラスターが残りのデータセンターで動作を継続できるようにします。失われたデータセンターが復旧すると、クラスターは失われたデータを回復し、通常の動作に戻ります。

注記
In a stretch cluster, when a site goes down and the cluster enters a degraded state, the min_size of the pool may be temporarily reduced (e.g., to 1) to allow the placement groups (PGs) to become active and continue serving I/O. However, the size of the pool remains unchanged. The peering_crush_bucket_count stretch mode flag ensures that PGs does not become active unless they are backed by OSDs in a minimum number of distinct CRUSH buckets (e.g., different data centers). This mechanism prevents the system from creating redundant copies solely within the surviving site, ensuring that data is only fully replicated once the downed site recovers.
Copy to Clipboard Toggle word wrap

欠落しているデータセンターが再びアクセス可能になると、クラスターは recovery ストレッチモードに入ります。これにより、警告が変更され、ピアリングが許可されますが、必要なものは、データセンターからの OSD のみであり、ずっと稼働していました。

すべての PG が既知の状態にあり、劣化でも不完全でもない場合、クラスターは通常のストレッチモードに戻り、警告を終了し、min_size を開始値 2 に戻します。クラスターは、常に稼働していたサイトだけでなく、両方のサイトをピアリングする必要があるため、必要に応じて、他のサイトにフェイルオーバーできます。

ストレッチモードの制限

  • 一度ストレッチモードに入ると、解除できません。
  • ストレッチモードのクラスターでイレイジャーコーディングされたプールを使用することはできません。イレイジャーコーディングされたプールでストレッチモードに入ることも、ストレッチモードがアクティブな場合にイレイジャーコーディングされたプールを作成することもできません。
  • デバイスクラスはストレッチモードではサポートされていません。次の例では、class hdd はサポートされていません。

    rule stretch_replicated_rule
    {id 2
    type replicated class hdd
    step take default
    step choose firstn 0 type datacenter
    step chooseleaf firstn 2 type host
    step emit
    }
    Copy to Clipboard Toggle word wrap

    両方のサイトで同じ重みを実現するには、2 つのサイトにデプロイされた Ceph OSD のサイズが同じである必要があります。つまり、最初のサイトのストレージ容量は 2 番目のサイトのストレージ容量と同じです。

  • 強制ではありませんが、各サイトで 2 つの Ceph モニターを実行し、tiebreaker を 1 つ、合計 5 つ実行する必要があります。これは、ストレッチモードの場合、OSD が自分のサイトのモニターにしか接続できないためです。
  • 独自の CRUSH ルールを作成する必要があります。これにより、各サイトに 2 つのコピーが提供され、両方のサイトで合計 4 つになります。
  • デフォルト以外のサイズまたは min_size の既存のプールがある場合は、ストレッチモードを有効にすることはできません。
  • クラスターは劣化時に min_size 1 で実行されるため、オールフラッシュ OSD ではストレッチモードのみを使用する必要があります。これにより、接続が復元された後の回復に必要な時間が最小限に抑えられ、データ損失の可能性が最小限に抑えられます。

ストレッチピアリングルール

Ceph ストレッチクラスターモードでは、ストレッチピアリングルールを通じて重要な安全対策が実施され、単一のデータセンターやクラウドアベイラビリティーゾーンなどの単一の障害ドメイン内にすべての動作レプリカが存在する場合、配置グループ (PG) がアクティブにならないようにします。

この動作は、サイト障害時にデータの整合性を保護するために不可欠です。すべてのレプリカが 1 つのサイトに限定された状態で PG をアクティブにできる場合、真の冗長性が確保されずに書き込み操作が誤って確認される可能性があります。サイトが停止した場合、これらの PG のデータが完全に失われることになります。動作セット内でゾーンの多様性を適用することにより、Ceph ストレッチクラスターは、データの不整合や損失のリスクを最小限に抑えながら、高い可用性を維持します。

トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2025 Red Hat