ホーム
製品
OpenShift Container Platform
4.19
AI ワークロード
3.3. Leader Worker Set Operator による分散ワークロードの管理

3.3. Leader Worker Set Operator による分散ワークロードの管理

Leader Worker Set Operator を使用すると、分散推論ワークロードを管理し、大規模な推論リクエストを効率的に処理できます。

3.3.1. Leader Worker Set Operator のインストール
リンクのコピー

OpenShift Container Platform Web コンソールから Leader Worker Set Operator をインストールし、分散 AI ワークロードの管理を開始できます。

前提条件

cluster-admin 権限でクラスターにアクセスできる。
OpenShift Container Platform Web コンソールにアクセスできる。
cert-manager Operator for Red Hat OpenShift がインストールされている。

手順

OpenShift Container Platform Web コンソールにログインします。
cert-manager Operator for Red Hat OpenShift がインストールされていることを確認します。
Leader Worker Set Operator をインストールします。
1. Operators OperatorHub に移動します。
2. フィルターボックスに Leader Worker Set Operator と入力します。
3. Leader Worker Set Operator を選択し、Install をクリックします。
4. Install Operator ページで以下を行います。
  1. Update channel を stable-v1.0 に設定します。これにより、Leader Worker Set Operator 1.0 の最新の安定版リリースがインストールされます。
  2. Installation mode で、A specific namespace on the cluster を選択します。
  3. Installed Namespace の下で、Operator recommended Namespace: openshift-lws-operator を選択します。
  4. Update approval で、次のいずれかの更新ストラテジーを選択します。
    Automatic ストラテジーを使用すると、新しいバージョンが利用可能になったときに、Operator Lifecycle Manager (OLM) によって Operator を自動的に更新できます。
    Manual ストラテジーには、Operator の更新を承認するための適切な認証情報を持つユーザーが必要です。
  5. Install をクリックします。
Leader Worker Set Operator のカスタムリソース (CR) を作成します。
1. Installed Operators Leader Worker Set Operator に移動します。
2. Provided APIs の下にある LeaderWorkerSetOperator ペインで Create instance をクリックします。
3. Create をクリックします。

3.3.2. リーダーワーカーセットのデプロイ
リンクのコピー

Leader Worker Set Operator を使用すると、リーダーワーカーセットをデプロイして、複数のノード間で分散されるワークロードの管理を支援できます。

前提条件

Leader Worker Set Operator をインストールした。

手順

次のコマンドを実行して新しいプロジェクトを作成します。
```
oc new-project my-namespace
```
```
$ oc new-project my-namespace
```
Copy to Clipboard Toggle word wrap

leader-worker-set.yaml という名前のファイルを作成します。

apiVersion: leaderworkerset.x-k8s.io/v1
kind: LeaderWorkerSet
metadata:
  generation: 1
  name: my-lws
  namespace: my-namespace
spec:
  leaderWorkerTemplate:
    leaderTemplate:
      metadata: {}
      spec:
        containers:
        - image: nginxinc/nginx-unprivileged:1.27
          name: leader
          resources: {}
    restartPolicy: RecreateGroupOnPodRestart
    size: 3
    workerTemplate:
      metadata: {}
      spec:
        containers:
        - image: nginxinc/nginx-unprivileged:1.27
          name: worker
          ports:
          - containerPort: 8080
            protocol: TCP
          resources: {}
  networkConfig:
    subdomainPolicy: Shared
  replicas: 2
  rolloutStrategy:
    rollingUpdateConfiguration:
      maxSurge: 1
      maxUnavailable: 1
    type: RollingUpdate
  startupPolicy: LeaderCreated

apiVersion: leaderworkerset.x-k8s.io/v1
kind: LeaderWorkerSet
metadata:
  generation: 1
  name: my-lws
  namespace: my-namespace
spec:
  leaderWorkerTemplate:
    leaderTemplate:
      metadata: {}
      spec:
        containers:
        - image: nginxinc/nginx-unprivileged:1.27
          name: leader
          resources: {}
    restartPolicy: RecreateGroupOnPodRestart
    size: 3
    workerTemplate:
      metadata: {}
      spec:
        containers:
        - image: nginxinc/nginx-unprivileged:1.27
          name: worker
          ports:
          - containerPort: 8080
            protocol: TCP
          resources: {}
  networkConfig:
    subdomainPolicy: Shared
  replicas: 2
  rolloutStrategy:
    rollingUpdateConfiguration:
      maxSurge: 1
      maxUnavailable: 1
    type: RollingUpdate
  startupPolicy: LeaderCreated

Copy to Clipboard

Toggle word wrap

各項目の説明:

metadata.name: リーダーワーカーセットリソースの名前を指定します。
metadata.namespace: リーダーワーカーの実行に使用する namespace を指定します。
spec.leaderWorkerTemplate.leaderTemplate: リーダー Pod の Pod テンプレートを指定します。
spec.leaderWorkerTemplate.restartPolicy: Pod の問題が発生した場合にの再起動ポリシーを指定します。使用できる値は、グループ全体を再起動する RecreateGroupOnPodRestart か、グループを再起動しない None です。
spec.leaderWorkerTemplate.size: リーダー Pod を含む、各グループに作成する Pod の数を指定します。たとえば、値が 3 の場合、リーダー Pod 1 個とワーカー Pod 2 個が作成されます。デフォルト値は 1 です。
spec.leaderWorkerTemplate.workerTemplate: ワーカー Pod の Pod テンプレートを指定します。
spec.networkConfig.subdomainPolicy: ヘッドレスサービスの作成時に使用するポリシーを指定します。使用できる値は UniquePerReplica または Shared です。デフォルト値は Shared です。
spec.replicas: レプリカまたはリーダーワーカーグループの数を指定します。デフォルト値は 1 です。
spec.rolloutStrategy.rollingUpdateConfiguration.maxSurge: ローリング更新中にレプリカ値を超えてスケジュールできる レプリカ の最大数を指定します。値は整数またはパーセンテージで指定できます。

設定可能なすべてのフィールドの詳細は、LeaderWorkerSet API のアップストリームドキュメントを参照してください。

次のコマンドを実行して、リーダーワーカーセットの設定を適用します。
```
oc apply -f leader-worker-set.yaml
```
```
$ oc apply -f leader-worker-set.yaml
```
Copy to Clipboard Toggle word wrap

検証

次のコマンドを実行して、Pod が作成されたことを確認します。

oc get pods -n my-namespace

$ oc get pods -n my-namespace

Copy to Clipboard

Toggle word wrap

出力例

NAME         READY   STATUS    RESTARTS   AGE
my-lws-0     1/1     Running   0          4s
my-lws-0-1   1/1     Running   0          3s
my-lws-0-2   1/1     Running   0          3s
my-lws-1     1/1     Running   0          7s
my-lws-1-1   1/1     Running   0          6s
my-lws-1-2   1/1     Running   0          6s

NAME         READY   STATUS    RESTARTS   AGE
my-lws-0     1/1     Running   0          4s
my-lws-0-1   1/1     Running   0          3s
my-lws-0-2   1/1     Running   0          3s
my-lws-1     1/1     Running   0          7s
my-lws-1-1   1/1     Running   0          6s
my-lws-1-2   1/1     Running   0          6s

Copy to Clipboard

Toggle word wrap

my-lws-0 は、最初のグループのリーダー Pod です。
my-lws-1 は 2 番目のグループのリーダー Pod です。

次のコマンドを実行して、ステートフルセットを確認します。
```
oc get statefulsets
```
```
$ oc get statefulsets
```
Copy to Clipboard Toggle word wrap
出力例
```
NAME       READY   AGE
my-lws     4/4     111s
my-lws-0   2/2     57s
my-lws-1   2/2     60s
```
```
NAME       READY   AGE
my-lws     4/4     111s
my-lws-0   2/2     57s
my-lws-1   2/2     60s
```
Copy to Clipboard Toggle word wrap
- my-lws は、すべてのリーダーワーカーグループのリーダーステートフルセットです。
- my-lws-0 は、最初のグループのワーカーステートフルセットです。
- my-lws-1 は 2 番目のグループのワーカーステートフルセットです。

3.3. Leader Worker Set Operator による分散ワークロードの管理

3.3.1. Leader Worker Set Operator のインストール
リンクのコピー

3.3.2. リーダーワーカーセットのデプロイ
リンクのコピー

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

3.3. Leader Worker Set Operator による分散ワークロードの管理

3.3.1. Leader Worker Set Operator のインストールリンクのコピーリンクがクリップボードにコピーされました!

3.3.2. リーダーワーカーセットのデプロイリンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

多様性を受け入れるオープンソースの強化

会社概要

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

3.3.1. Leader Worker Set Operator のインストール
リンクのコピー

3.3.2. リーダーワーカーセットのデプロイ
リンクのコピー