8.15. 高度な仮想マシン管理

8.15.1. 仮想マシンのリソースクォータの使用
リンクのコピー

仮想マシンのリソースクォータの作成および管理

8.15.1.1. 仮想マシンのリソースクォータ制限の設定
リンクのコピー

リクエストのみを使用するリソースクォータは、仮想マシン (VM) で自動的に機能します。リソースクォータで制限を使用する場合は、VM に手動でリソース制限を設定する必要があります。リソース制限は、リソース要求より少なくとも 100 MiB 大きくする必要があります。

手順

VirtualMachine マニフェストを編集して、VM の制限を設定します。以下に例を示します。

apiVersion: kubevirt.io/v1
kind: VirtualMachine
metadata:
  name: with-limits
spec:
  running: false
  template:
    spec:
      domain:
# ...
        resources:
          requests:
            memory: 128Mi
          limits:
            memory: 256Mi

1

1: この設定がサポートされるのは、limits.memory 値が requests.memory 値より少なくとも 100Mi 大きいためです。

VirtualMachine マニフェストを保存します。

8.15.2. 仮想マシンのノードの指定
リンクのコピー

ノードの配置ルールを使用して、仮想マシン (VM) を特定のノードに配置することができます。

8.15.2.1. 仮想マシンのノード配置について
リンクのコピー

仮想マシン (VM) が適切なノードで実行されるようにするには、ノードの配置ルールを設定できます。以下の場合にこれを行うことができます。

仮想マシンが複数ある。フォールトトレランスを確保するために、これらを異なるノードで実行する必要がある。
2 つの相互間のネットワークトラフィックの多い chatty VM がある。冗長なノード間のルーティングを回避するには、仮想マシンを同じノードで実行します。
仮想マシンには、利用可能なすべてのノードにない特定のハードウェア機能が必要です。
機能をノードに追加する Pod があり、それらの機能を使用できるように仮想マシンをそのノードに配置する必要があります。

注記

仮想マシンの配置は、ワークロードの既存のノードの配置ルールに基づきます。ワークロードがコンポーネントレベルの特定のノードから除外される場合、仮想マシンはそれらのノードに配置できません。

以下のルールタイプは、VirtualMachine マニフェストの spec フィールドで使用できます。

nodeSelector: 仮想マシンは、キーと値のペアまたはこのフィールドで指定したペアを使用してラベルが付けられたノードに Pod をスケジュールできます。ノードには、一覧表示されたすべてのペアに一致するラベルがなければなりません。
affinity: より表現的な構文を使用して、ノードと仮想マシンに一致するルールを設定できます。たとえば、ルールがハード要件ではなく基本設定になるように指定し、ルールの条件が満たされない場合も仮想マシンがスケジュールされるようにすることができます。Pod のアフィニティー、Pod の非アフィニティー、およびノードのアフィニティーは仮想マシンの配置でサポートされます。Pod のアフィニティーは仮想マシンに対して動作します。VirtualMachine ワークロードタイプは Pod オブジェクトに基づくためです。
注記
アフィニティールールは、スケジューリング時にのみ適用されます。OpenShift Container Platform は、制約を満たさなくなった場合に実行中のワークロードを再スケジューリングしません。
tolerations: 一致するテイントを持つノードで仮想マシンをスケジュールできます。テイントがノードに適用される場合、そのノードはテイントを容認する仮想マシンのみを受け入れます。

8.15.2.2. ノード配置の例
リンクのコピー

以下の YAML スニペットの例では、nodePlacement、affinity、および tolerations フィールドを使用して仮想マシンのノード配置をカスタマイズします。

8.15.2.2.1. 例: nodeSelector を使用した仮想マシンノードの配置
リンクのコピー

この例では、仮想マシンに example-key-1 = example-value-1 および example-key-2 = example-value-2 ラベルの両方が含まれるメタデータのあるノードが必要です。

警告

この説明に該当するノードがない場合、仮想マシンはスケジュールされません。

仮想マシンマニフェストの例

metadata:
  name: example-vm-node-selector
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  template:
    spec:
      nodeSelector:
        example-key-1: example-value-1
        example-key-2: example-value-2
...

8.15.2.2.2. 例: Pod のアフィニティーおよび Pod の非アフィニティーによる仮想マシンノードの配置
リンクのコピー

この例では、仮想マシンはラベル example-key-1 = example-value-1 を持つ実行中の Pod のあるノードでスケジュールされる必要があります。このようなノードで実行中の Pod がない場合、仮想マシンはスケジュールされません。

可能な場合に限り、仮想マシンはラベル example-key-2 = example-value-2 を持つ Pod のあるノードではスケジュールされません。ただし、すべての候補となるノードにこのラベルを持つ Pod がある場合、スケジューラーはこの制約を無視します。

仮想マシンマニフェストの例

metadata:
  name: example-vm-pod-affinity
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  affinity:
    podAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:

1


      - labelSelector:
          matchExpressions:
          - key: example-key-1
            operator: In
            values:
            - example-value-1
        topologyKey: kubernetes.io/hostname
    podAntiAffinity:
      preferredDuringSchedulingIgnoredDuringExecution:

2


      - weight: 100
        podAffinityTerm:
          labelSelector:
            matchExpressions:
            - key: example-key-2
              operator: In
              values:
              - example-value-2
          topologyKey: kubernetes.io/hostname
...

1: requiredDuringSchedulingIgnoredDuringExecution ルールタイプを使用する場合、制約を満たさない場合には仮想マシンはスケジュールされません。
2: preferredDuringSchedulingIgnoredDuringExecution ルールタイプを使用する場合、この制約を満たさない場合でも、必要なすべての制約を満たす場合に仮想マシンは依然としてスケジュールされます。

8.15.2.2.3. 例: ノードのアフィニティーによる仮想マシンノードの配置
リンクのコピー

この例では、仮想マシンはラベル example.io/example-key = example-value-1 またはラベル example.io/example-key = example-value-2 を持つノードでスケジュールされる必要があります。この制約は、ラベルのいずれかがノードに存在する場合に満たされます。いずれのラベルも存在しない場合、仮想マシンはスケジュールされません。

可能な場合、スケジューラーはラベル example-node-label-key = example-node-label-value を持つノードを回避します。ただし、すべての候補となるノードにこのラベルがある場合、スケジューラーはこの制約を無視します。

仮想マシンマニフェストの例

metadata:
  name: example-vm-node-affinity
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  affinity:
    nodeAffinity:
      requiredDuringSchedulingIgnoredDuringExecution:

1


        nodeSelectorTerms:
        - matchExpressions:
          - key: example.io/example-key
            operator: In
            values:
            - example-value-1
            - example-value-2
      preferredDuringSchedulingIgnoredDuringExecution:

2


      - weight: 1
        preference:
          matchExpressions:
          - key: example-node-label-key
            operator: In
            values:
            - example-node-label-value
...

1: requiredDuringSchedulingIgnoredDuringExecution ルールタイプを使用する場合、制約を満たさない場合には仮想マシンはスケジュールされません。
2: preferredDuringSchedulingIgnoredDuringExecution ルールタイプを使用する場合、この制約を満たさない場合でも、必要なすべての制約を満たす場合に仮想マシンは依然としてスケジュールされます。

8.15.2.2.4. 例: 容認 (toleration) を使用した仮想マシンノードの配置
リンクのコピー

この例では、仮想マシン用に予約されるノードには、すでに key=virtualization:NoSchedule テイントのラベルが付けられています。この仮想マシンには一致する tolerations があるため、これをテイントが付けられたノードにスケジュールできます。

注記

テイントを容認する仮想マシンは、そのテイントを持つノードにスケジュールする必要はありません。

仮想マシンマニフェストの例

metadata:
  name: example-vm-tolerations
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  tolerations:
  - key: "key"
    operator: "Equal"
    value: "virtualization"
    effect: "NoSchedule"
...

8.15.3. 証明書ローテーションの設定
リンクのコピー

証明書ローテーションパラメーターを設定して、既存の証明書を置き換えます。

8.15.3.1. 証明書ローテーションの設定
リンクのコピー

これは、Web コンソールでの OpenShift Virtualization のインストール時に、または HyperConverged カスタムリソース (CR) でインストール後に実行することができます。

手順

以下のコマンドを実行して HyperConverged CR を開きます。
```
$ oc edit hco -n openshift-cnv kubevirt-hyperconverged
```
以下の例のように spec.certConfig フィールドを編集します。システムのオーバーロードを避けるには、すべての値が 10 分以上であることを確認します。golang ParseDuration 形式に準拠する文字列として、すべての値を表現します。
```
apiVersion: hco.kubevirt.io/v1beta1
kind: HyperConverged
metadata:
 name: kubevirt-hyperconverged
 namespace: openshift-cnv
spec:
  certConfig:
    ca:
      duration: 48h0m0s
      renewBefore: 24h0m0s 
```
1
```
    server:
      duration: 24h0m0s  
```
2
```
      renewBefore: 12h0m0s  
```
3
1
ca.renewBefore の値は ca.duration の値以下である必要があります。
2
server.duration の値は ca.duration の値以下である必要があります。
3
server.renewBefore の値は server.duration の値以下である必要があります。
YAML ファイルをクラスターに適用します。

8.15.3.2. 証明書ローテーションパラメーターのトラブルシューティング
リンクのコピー

1 つ以上の certConfig 値を削除すると、デフォルト値が以下のいずれかの条件と競合する場合を除き、デフォルト値に戻ります。

ca.renewBefore の値は ca.duration の値以下である必要があります。
server.duration の値は ca.duration の値以下である必要があります。
server.renewBefore の値は server.duration の値以下である必要があります。

デフォルト値がこれらの条件と競合すると、エラーが発生します。

以下の例で server.duration 値を削除すると、デフォルト値の 24h0m0s は ca.duration の値よりも大きくなり、指定された条件と競合します。

例

certConfig:
   ca:
     duration: 4h0m0s
     renewBefore: 1h0m0s
   server:
     duration: 4h0m0s
     renewBefore: 4h0m0s

これにより、以下のエラーメッセージが表示されます。

error: hyperconvergeds.hco.kubevirt.io "kubevirt-hyperconverged" could not be patched: admission webhook "validate-hco.kubevirt.io" denied the request: spec.certConfig: ca.duration is smaller than server.duration

エラーメッセージには、最初の競合のみが記載されます。続行する前に、すべての certConfig の値を確認します。

8.15.4. 管理タスクの自動化
リンクのコピー

Red Hat Ansible Automation Platform を使用すると、OpenShift Virtualization 管理タスクを自動化できます。Ansible Playbook を使用して新規の仮想マシンを作成する際の基本事項を確認します。

8.15.4.1. Red Hat Ansible Automation について
リンクのコピー

Ansible は、システムの設定、ソフトウェアのデプロイ、およびローリング更新の実行に使用する自動化ツールです。Ansible には OpenShift Virtualization のサポートが含まれ、Ansible モジュールを使用すると、テンプレート、永続ボリューム要求 (PVC) および仮想マシンの操作などのクラスター管理タスクを自動化できます。

Ansible は、oc CLI ツールや API を使用しても実行できる OpenShift Virtualization の管理を自動化する方法を提供します。Ansible は、KubeVirt モジュールを他の Ansible モジュールと統合できる点でユニークであると言えます。

8.15.4.2. 仮想マシン作成の自動化
リンクのコピー

kubevirt_vm Ansible Playbook を使用し、Red Hat Ansible Automation Platform を使用して OpenShift Container Platform クラスターに仮想マシンを作成できます。

前提条件

Red Hat Ansible Engine バージョン 2.8 以降。

手順

kubevirt_vm タスクを含むように Ansible Playbook YAML ファイルを編集します。

  kubevirt_vm:
    namespace:
    name:
    cpu_cores:
    memory:
    disks:
      - name:
        volume:
          containerDisk:
            image:
        disk:
          bus:

注記

このスニペットには Playbook の kubevirt_vm 部分のみが含まれます。

namespace、cpu_cores の数、memory、および disks を含む、作成する必要のある仮想マシンを反映させるように値を編集します。以下に例を示します。

  kubevirt_vm:
    namespace: default
    name: vm1
    cpu_cores: 1
    memory: 64Mi
    disks:
      - name: containerdisk
        volume:
          containerDisk:
            image: kubevirt/cirros-container-disk-demo:latest
        disk:
          bus: virtio

仮想マシンを作成後すぐに起動する必要がある場合には、state: running を YAML ファイルに追加します。以下に例を示します。
```
  kubevirt_vm:
    namespace: default
    name: vm1
    state: running 
```
1
```
    cpu_cores: 1
```
1
この値を state: absent に変更すると、すでに存在する場合に仮想マシンは削除されます。
Playbook のファイル名を引数としてのみ使用して、 ansible-playbook コマンドを実行します。
```
$ ansible-playbook create-vm.yaml
```

出力を確認し、プレイが正常に実行されたかどうかを確認します。

出力例

(...)
TASK [Create my first VM] ************************************************************************
changed: [localhost]

PLAY RECAP ********************************************************************************************************
localhost                  : ok=2    changed=1    unreachable=0    failed=0    skipped=0    rescued=0    ignored=0

Playbook ファイルに state: running を含めず、すぐに仮想マシンを起動する必要がある場合には、 state: running を含めるようにファイルを編集し、Playbook を再度実行します。
```
$ ansible-playbook create-vm.yaml
```

仮想マシンが作成されたことを確認するには、仮想マシンコンソールへのアクセスを試行します。

8.15.4.3. 例: 仮想マシンを作成するための Ansible Playbook
リンクのコピー

kubevirt_vm Ansible Playbook を使用して仮想マシン作成を自動化できます。

以下の YAML ファイルは kubevirt_vm Playbook の例です。これには、Playbook を実行する際に独自の情報を置き換える必要のあるサンプルの値が含まれます。

---
- name: Ansible Playbook 1
  hosts: localhost
  connection: local
  tasks:
    - name: Create my first VM
      kubevirt_vm:
        namespace: default
        name: vm1
        cpu_cores: 1
        memory: 64Mi
        disks:
          - name: containerdisk
            volume:
              containerDisk:
                image: kubevirt/cirros-container-disk-demo:latest
            disk:
              bus: virtio

追加情報

8.15.5. 仮想マシンに UEFI モードを使用する
リンクのコピー

Unified Extensible Firmware Interface (UEFI) モードで仮想マシン (VM) を起動できます。

8.15.5.1. 仮想マシンの UEFI モードについて
リンクのコピー

レガシー BIOS などの Unified Extensible Firmware Interface (UEFI) は、コンピューターの起動時にハードウェアコンポーネントやオペレーティングシステムのイメージファイルを初期化します。UEFI は BIOS よりも最新の機能とカスタマイズオプションをサポートするため、起動時間を短縮できます。

これは、.efi 拡張子を持つファイルに初期化と起動に関する情報をすべて保存します。このファイルは、EFI System Partition (ESP) と呼ばれる特別なパーティションに保管されます。ESP には、コンピューターにインストールされるオペレーティングシステムのブートローダープログラムも含まれます。

8.15.5.2. UEFI モードでの仮想マシンの起動
リンクのコピー

VirtualMachine マニフェストを編集して、UEFI モードで起動するように仮想マシンを設定できます。

前提条件

OpenShift CLI (oc) がインストールされている。

手順

VirtualMachine マニフェストファイルを編集または作成します。spec.firmware.bootloader スタンザを使用して、UEFI モードを設定します。
セキュアブートがアクティブな状態の UEFI モードでのブート
```
apiversion: kubevirt.io/v1
kind: VirtualMachine
metadata:
  labels:
    special: vm-secureboot
  name: vm-secureboot
spec:
  template:
    metadata:
      labels:
        special: vm-secureboot
    spec:
      domain:
        devices:
          disks:
          - disk:
              bus: virtio
            name: containerdisk
        features:
          acpi: {}
          smm:
            enabled: true 
```
1
```
        firmware:
          bootloader:
            efi:
              secureBoot: true 
```
2
```
...
```
1
OpenShift Virtualization では、UEFI モードでセキュアブートを実行するために SMM (System Management Mode) を有効にする必要があります。
2
OpenShift Virtualization は、UEFI モードを使用する場合に、セキュアブートの有無に関わらず、仮想マシンをサポートします。セキュアブートが有効な場合には、UEFI モードが必要です。ただし、セキュアブートを使用せずに UEFI モードを有効にできます。
以下のコマンドを実行して、マニフェストをクラスターに適用します。
```
$ oc create -f <file_name>.yaml
```

8.15.6. 仮想マシンの PXE ブートの設定
リンクのコピー

PXE ブートまたはネットワークブートは OpenShift Virtualization で利用できます。ネットワークブートにより、ローカルに割り当てられたストレージデバイスなしにコンピューターを起動し、オペレーティングシステムまたは他のプログラムを起動し、ロードすることができます。たとえば、これにより、新規ホストのデプロイ時に PXE サーバーから必要な OS イメージを選択できます。

8.15.6.1. 前提条件
リンクのコピー

Linux ブリッジが接続されていること。
PXE サーバーがブリッジとして同じ VLAN に接続されていること。

8.15.6.2. MAC アドレスを指定した PXE ブート
リンクのコピー

まず、管理者は PXE ネットワークの NetworkAttachmentDefinition オブジェクトを作成し、ネットワーク経由でクライアントを起動できます。次に、仮想マシンインスタンスの設定ファイルでネットワーク接続定義を参照して仮想マシンインスタンスを起動します。また PXE サーバーで必要な場合には、仮想マシンインスタンスの設定ファイルで MAC アドレスを指定することもできます。

前提条件

Linux ブリッジが接続されていること。
PXE サーバーがブリッジとして同じ VLAN に接続されていること。

手順

クラスターに PXE ネットワークを設定します。

PXE ネットワーク pxe-net-conf のネットワーク接続定義ファイルを作成します。

apiVersion: "k8s.cni.cncf.io/v1"
kind: NetworkAttachmentDefinition
metadata:
  name: pxe-net-conf
spec:
  config: '{
    "cniVersion": "0.3.1",
    "name": "pxe-net-conf",
    "plugins": [
      {
        "type": "cnv-bridge",
        "bridge": "br1",
        "vlan": 1

1


      },
      {
        "type": "cnv-tuning"

2


      }
    ]
  }'

1: オプション: VLAN タグ。
2: cnv-tuning プラグインは、カスタム MAC アドレスのサポートを提供します。

注記

仮想マシンインスタンスは、必要な VLAN のアクセスポートでブリッジ br1 に割り当てられます。

直前の手順で作成したファイルを使用してネットワーク接続定義を作成します。
```
$ oc create -f pxe-net-conf.yaml
```
仮想マシンインスタンス設定ファイルを、インターフェイスおよびネットワークの詳細を含めるように編集します。
1. PXE サーバーで必要な場合には、ネットワークおよび MAC アドレスを指定します。MAC アドレスが指定されていない場合、値は自動的に割り当てられます。
  bootOrder が 1 に設定されており、インターフェイスが最初に起動することを確認します。この例では、インターフェイスは <pxe-net> というネットワークに接続されています。
  interfaces: - masquerade: {} name: default - bridge: {} name: pxe-net macAddress: de:00:00:00:00:de bootOrder: 1
  注記
  複数のインターフェイスおよびディスクのブートの順序はグローバル順序になります。
2. オペレーティングシステムのプロビジョニング後に起動が適切に実行されるよう、ブートデバイス番号をディスクに割り当てます。
  ディスク bootOrder の値を 2 に設定します。
  devices: disks: - disk: bus: virtio name: containerdisk bootOrder: 2
3. 直前に作成されたネットワーク接続定義に接続されるネットワークを指定します。このシナリオでは、<pxe-net> は <pxe-net-conf> というネットワーク接続定義に接続されます。
  networks: - name: default pod: {} - name: pxe-net multus: networkName: pxe-net-conf
仮想マシンインスタンスを作成します。
```
$ oc create -f vmi-pxe-boot.yaml
```

出力例

  virtualmachineinstance.kubevirt.io "vmi-pxe-boot" created

仮想マシンインスタンスの実行を待機します。

$ oc get vmi vmi-pxe-boot -o yaml | grep -i phase
  phase: Running

VNC を使用して仮想マシンインスタンスを表示します。
```
$ virtctl vnc vmi-pxe-boot
```
ブート画面で、PXE ブートが正常に実行されていることを確認します。
仮想マシンインスタンスにログインします。
```
$ virtctl console vmi-pxe-boot
```
仮想マシンのインターフェイスおよび MAC アドレスを確認し、ブリッジに接続されたインターフェイスに MAC アドレスが指定されていることを確認します。この場合、PXE ブートには IP アドレスなしに eth1 を使用しています。他のインターフェイス eth0 は OpenShift Container Platform から IP アドレスを取得しています。
```
$ ip addr
```

出力例

...
3. eth1: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000
   link/ether de:00:00:00:00:de brd ff:ff:ff:ff:ff:ff

8.15.6.3. OpenShift Virtualization ネットワークの用語集
リンクのコピー

OpenShift Virtualization は、カスタムリソースおよびプラグインを使用して高度なネットワーク機能を提供します。

以下の用語は、OpenShift Virtualization ドキュメント全体で使用されています。

Container Network Interface (CNI): コンテナーのネットワーク接続に重点を置く Cloud Native Computing Foundation プロジェクト。OpenShift Virtualization は CNI プラグインを使用して基本的な Kubernetes ネットワーク機能を強化します。
Multus: 複数の CNI の存在を可能にし、Pod または仮想マシンが必要なインターフェイスを使用できるようにするメタ CNI プラグイン。
カスタムリソース定義 (CRD、Custom Resource Definition): カスタムリソースの定義を可能にする Kubernetes API リソース、または CRD API リソースを使用して定義されるオブジェクト。
ネットワーク接続定義 (NAD): Pod、仮想マシン、および仮想マシンインスタンスを 1 つ以上のネットワークに割り当てることを可能にする Multus プロジェクトによって導入される CRD。
ノードネットワーク設定ポリシー (NNCP): ノードで要求されるネットワーク設定の説明。NodeNetworkConfigurationPolicy マニフェストをクラスターに適用して、インターフェイスの追加および削除など、ノードネットワーク設定を更新します。
PXE (Preboot eXecution Environment): 管理者がネットワーク経由でサーバーからクライアントマシンを起動できるようにするインターフェイス。ネットワークのブートにより、オペレーティングシステムおよび他のソフトウェアをクライアントにリモートでロードできます。

8.15.7. 仮想マシンでの Huge Page の使用
リンクのコピー

Huge Page は、クラスター内の仮想マシンのバッキングメモリーとして使用できます。

8.15.7.1. 前提条件
リンクのコピー

ノードには事前に割り当てられた Huge Page が設定されている。

8.15.7.2. Huge Page の機能
リンクのコピー

メモリーは Page と呼ばれるブロックで管理されます。多くのシステムでは、1 ページは 4Ki です。メモリー 1Mi は 256 ページに、メモリー 1Gi は 256,000 ページに相当します。CPU には、内蔵のメモリー管理ユニットがあり、ハードウェアでこのようなページリストを管理します。トランスレーションルックアサイドバッファー (TLB: Translation Lookaside Buffer) は、仮想から物理へのページマッピングの小規模なハードウェアキャッシュのことです。ハードウェアの指示で渡された仮想アドレスが TLB にあれば、マッピングをすばやく決定できます。そうでない場合には、TLB ミスが発生し、システムは速度が遅く、ソフトウェアベースのアドレス変換にフォールバックされ、パフォーマンスの問題が発生します。TLB のサイズは固定されているので、TLB ミスの発生率を減らすには Page サイズを大きくする必要があります。

Huge Page とは、4Ki より大きいメモリーページのことです。x86_64 アーキテクチャーでは、2Mi と 1Gi の 2 つが一般的な Huge Page サイズです。別のアーキテクチャーではサイズは異なります。Huge Page を使用するには、アプリケーションが認識できるようにコードを書き込む必要があります。Transparent Huge Pages (THP) は、アプリケーションによる認識なしに、Huge Page の管理を自動化しようとしますが、制約があります。特に、ページサイズは 2Mi に制限されます。THP では、THP のデフラグが原因で、メモリー使用率が高くなり、断片化が起こり、パフォーマンスの低下につながり、メモリーページがロックされてしまう可能性があります。このような理由から、アプリケーションは THP ではなく、事前割り当て済みの Huge Page を使用するように設計 (また推奨) される場合があります。

OpenShift Virtualization では、事前に割り当てられた Huge Page を使用できるように仮想マシンを設定できます。

8.15.7.3. 仮想マシンの Huge Page の設定
リンクのコピー

memory.hugepages.pageSize および resources.requests.memory パラメーターを仮想マシン設定に組み込み、仮想マシンを事前に割り当てられた Huge Page を使用するように設定できます。

メモリー要求はページサイズ別に分ける必要があります。たとえば、ページサイズ 1Gi の場合に 500Mi メモリーを要求することはできません。

注記

ホストおよびゲスト OS のメモリーレイアウトには関連性がありません。仮想マシンマニフェストで要求される Huge Page が QEMU に適用されます。ゲスト内の Huge Page は、仮想マシンインスタンスの利用可能なメモリー量に基づいてのみ設定できます。

実行中の仮想マシンを編集する場合は、変更を有効にするために仮想マシンを再起動する必要があります。

前提条件

ノードには、事前に割り当てられた Huge Page が設定されている必要がある。

手順

仮想マシン設定で、resources.requests.memory および memory.hugepages.pageSize パラメーターを spec.domain に追加します。以下の設定スニペットは、ページサイズが 1Gi の合計 4Gi メモリーを要求する仮想マシンについてのものです。
```
kind: VirtualMachine
...
spec:
  domain:
    resources:
      requests:
        memory: "4Gi" 
```
1
```
    memory:
      hugepages:
        pageSize: "1Gi" 
```
2
```
...
```
1
仮想マシンに要求されるメモリーの合計量。この値はページサイズで分ける必要があります。
2
各 Huge Page のサイズ。x86_64 アーキテクチャーの有効な値は 1Gi および 2Mi です。ページサイズは要求されたメモリーよりも小さくなければなりません。
仮想マシン設定を適用します。
```
$ oc apply -f <virtual_machine>.yaml
```

8.15.8. 仮想マシン用の専用リソースの有効化
リンクのコピー

パフォーマンスを向上させるために、CPU などのノードリソースを仮想マシン専用に確保できます。

8.15.8.1. 専用リソースについて
リンクのコピー

仮想マシンの専用リソースを有効にする場合、仮想マシンのワークロードは他のプロセスで使用されない CPU でスケジュールされます。専用リソースを使用することで、仮想マシンのパフォーマンスとレイテンシーの予測の精度を向上させることができます。

8.15.8.2. 前提条件
リンクのコピー

CPU マネージャーがノードで設定されている。仮想マシンのワークロードをスケジュールする前に、ノードに cpumanager = true ラベルが設定されていることを確認する。
仮想マシンの電源がオフになっている。

8.15.8.3. 仮想マシンの専用リソースの有効化
リンクのコピー

Details タブで、仮想マシンの専用リソースを有効にすることができます。Red Hat テンプレートから作成された仮想マシンは、専用のリソースで設定できます。

手順

OpenShift Container Platform コンソールで、サイドメニューから Virtualization VirtualMachines をクリックします。
仮想マシンを選択して、VirtualMachine details ページを開きます。
Scheduling タブで、Dedicated Resources の横にある鉛筆アイコンをクリックします。
Schedule this workload with dedicated resources (guaranteed policy) を選択します。
Save をクリックします。

8.15.9. 仮想マシンのスケジュール
リンクのコピー

仮想マシンの CPU モデルとポリシー属性が、ノードがサポートする CPU モデルおよびポリシー属性との互換性について一致することを確認して、ノードで仮想マシン (VM) をスケジュールできます。

8.15.9.1. ポリシー属性
リンクのコピー

仮想マシン (VM) をスケジュールするには、ポリシー属性と、仮想マシンがノードでスケジュールされる際の互換性について一致する CPU 機能を指定します。仮想マシンに指定されるポリシー属性は、その仮想マシンをノードにスケジュールする方法を決定します。

Expand

ポリシー属性	Description
force	仮想マシンは強制的にノードでスケジュールされます。これは、ホストの CPU が仮想マシンの CPU に対応していない場合でも該当します。
require	仮想マシンが特定の CPU モデルおよび機能仕様で設定されていない場合に仮想マシンに適用されるデフォルトのポリシー。このデフォルトポリシー属性または他のポリシー属性のいずれかを持つ CPU ノードの検出をサポートするようにノードが設定されていない場合、仮想マシンはそのノードでスケジュールされません。ホストの CPU が仮想マシンの CPU をサポートしているか、ハイパーバイザーが対応している CPU モデルをエミュレートできる必要があります。
optional	仮想マシンがホストの物理マシンの CPU でサポートされている場合は、仮想マシンがノードに追加されます。
disable	仮想マシンは CPU ノードの検出機能と共にスケジュールすることはできません。
forbid	この機能がホストの CPU でサポートされ、CPU ノード検出が有効になっている場合でも、仮想マシンはスケジュールされません。

8.15.9.2. ポリシー属性および CPU 機能の設定
リンクのコピー

それぞれの仮想マシン (VM) にポリシー属性および CPU 機能を設定して、これがポリシーおよび機能に従ってノードでスケジュールされるようにすることができます。設定する CPU 機能は、ホストの CPU によってサポートされ、またはハイパーバイザーがエミュレートされることを確認するために検証されます。

手順

仮想マシン設定ファイルの domain 仕様を編集します。以下の例では、仮想マシン (VM) の CPU 機能および require ポリシーを設定します。

apiVersion: kubevirt.io/v1
kind: VirtualMachine
metadata:
  name: myvm
spec:
  template:
    spec:
      domain:
        cpu:
          features:
            - name: apic

1


              policy: require

2

1: 仮想マシンの名前。
2: 仮想マシンのポリシー属性。

8.15.9.3. サポートされている CPU モデルでの仮想マシンのスケジューリング
リンクのコピー

仮想マシン (VM) の CPU モデルを設定して、CPU モデルがサポートされるノードにこれをスケジュールできます。

手順

仮想マシン設定ファイルの domain 仕様を編集します。以下の例は、VM 向けに定義された特定の CPU モデルを示しています。

apiVersion: kubevirt.io/v1
kind: VirtualMachine
metadata:
  name: myvm
spec:
  template:
    spec:
      domain:
        cpu:
          model: Conroe

1

1: VM の CPU モデル。

8.15.9.4. ホストモデルでの仮想マシンのスケジューリング
リンクのコピー

仮想マシン (VM) の CPU モデルが host-model に設定されている場合、仮想マシンはスケジュールされているノードの CPU モデルを継承します。

手順

仮想マシン設定ファイルの domain 仕様を編集します。以下の例は、仮想マシン (VM) に指定される host-model を示しています。
```
apiVersion: kubevirt/v1alpha3
kind: VirtualMachine
metadata:
  name: myvm
spec:
  template:
    spec:
      domain:
        cpu:
          model: host-model 
```
1
1
スケジュールされるノードの CPU モデルを継承する仮想マシン。

8.15.10. PCI パススルーの設定
リンクのコピー

PCI (Peripheral Component Interconnect) パススルー機能を使用すると、仮想マシンからハードウェアデバイスにアクセスし、管理できます。PCI パススルーが設定されると、PCI デバイスはゲストオペレーティングシステムに物理的に接続されているかのように機能します。

クラスター管理者は、oc コマンドラインインターフェイス (CLI) を使用して、クラスターでの使用が許可されているホストデバイスを公開および管理できます。

8.15.10.1. PCI パススルー用ホストデバイスの準備について
リンクのコピー

CLI を使用して PCI パススルー用にホストデバイスを準備するには、MachineConfig オブジェクトを作成し、カーネル引数を追加して、Input-Output Memory Management Unit (IOMMU) を有効にします。PCI デバイスを Virtual Function I/O (VFIO) ドライバーにバインドしてから、HyperConverged カスタムリソース (CR) の permittedHostDevices フィールドを編集してクラスター内で公開します。OpenShift Virtualization Operator を最初にインストールする場合、permittedHostDevices の一覧は空になります。

CLI を使用してクラスターから PCI ホストデバイスを削除するには、HyperConverged CR から PCI デバイス情報を削除します。

8.15.10.1.1. IOMMU ドライバーを有効にするためのカーネル引数の追加
リンクのコピー

カーネルの IOMMU (Input-Output Memory Management Unit) ドライバーを有効にするには、MachineConfig オブジェクトを作成し、カーネル引数を追加します。

前提条件

作業用の OpenShift Container Platform クラスターに対する管理者権限が必要です。
Intel または AMD CPU ハードウェア。
Intel Virtualization Technology for Directed I/O 拡張または BIOS (Basic Input/Output System) の AMD IOMMU が有効にされている。

手順

カーネル引数を識別する MachineConfig オブジェクトを作成します。以下の例は、Intel CPU のカーネル引数を示しています。
```
apiVersion: machineconfiguration.openshift.io/v1
kind: MachineConfig
metadata:
  labels:
    machineconfiguration.openshift.io/role: worker 
```
1
```
  name: 100-worker-iommu 
```
2
```
spec:
  config:
    ignition:
      version: 3.2.0
  kernelArguments:
      - intel_iommu=on 
```
3
```
...
```
1
新しいカーネル引数をワーカーノードのみに適用します。
2
name は、マシン設定とその目的におけるこのカーネル引数 (100) のランクを示します。AMD CPU がある場合は、カーネル引数を amd_iommu=on として指定します。
3
Intel CPU の intel_iommu としてカーネル引数を特定します。
新規 MachineConfig オブジェクトを作成します。
```
$ oc create -f 100-worker-kernel-arg-iommu.yaml
```

検証

新規 MachineConfig オブジェクトが追加されていることを確認します。
```
$ oc get MachineConfig
```

8.15.10.1.2. PCI デバイスの VFIO ドライバーへのバインディング
リンクのコピー

PCI デバイスを VFIO (Virtual Function I/O) ドライバーにバインドするには、各デバイスから vendor-ID および device-ID の値を取得し、これらの値で一覧を作成します。一覧を MachineConfig オブジェクトに追加します。MachineConfig Operator は、PCI デバイスを持つノードで /etc/modprobe.d/vfio.conf を生成し、PCI デバイスを VFIO ドライバーにバインドします。

前提条件

カーネル引数を CPU の IOMMU を有効にするために追加している。

手順

lspci コマンドを実行して、PCI デバイスの vendor-ID および device-ID を取得します。

$ lspci -nnv | grep -i nvidia

出力例

02:01.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 PCIe 32GB] [10de:1eb8] (rev a1)

Butane 設定ファイル 100-worker-vfiopci.bu を作成し、PCI デバイスを VFIO ドライバーにバインドします。
注記
Butane の詳細は、Butane を使用したマシン設定の作成を参照してください。
例
```
variant: openshift
version: 4.10.0
metadata:
  name: 100-worker-vfiopci
  labels:
    machineconfiguration.openshift.io/role: worker 
```
1
```
storage:
  files:
  - path: /etc/modprobe.d/vfio.conf
    mode: 0644
    overwrite: true
    contents:
      inline: |
        options vfio-pci ids=10de:1eb8 
```
2
```
  - path: /etc/modules-load.d/vfio-pci.conf 
```
3
```
    mode: 0644
    overwrite: true
    contents:
      inline: vfio-pci
```
1
新しいカーネル引数をワーカーノードのみに適用します。
2
以前に決定された vendor-ID 値 (10de) と device-ID 値 (1eb8) を指定して、単一のデバイスを VFIO ドライバーにバインドします。複数のデバイスの一覧をベンダーおよびデバイス情報とともに追加できます。
3
ワーカーノードで vfio-pci カーネルモジュールを読み込むファイル。
Butane を使用して、ワーカーノードに配信される設定を含む MachineConfig オブジェクトファイル (100-worker-vfiopci.yaml) を生成します。
```
$ butane 100-worker-vfiopci.bu -o 100-worker-vfiopci.yaml
```
MachineConfig オブジェクトをワーカーノードに適用します。
```
$ oc apply -f 100-worker-vfiopci.yaml
```

MachineConfig オブジェクトが追加されていることを確認します。

$ oc get MachineConfig

出力例

NAME                             GENERATEDBYCONTROLLER                      IGNITIONVERSION  AGE
00-master                        d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
00-worker                        d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
01-master-container-runtime      d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
01-master-kubelet                d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
01-worker-container-runtime      d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
01-worker-kubelet                d3da910bfa9f4b599af4ed7f5ac270d55950a3a1   3.2.0            25h
100-worker-iommu                                                            3.2.0            30s
100-worker-vfiopci-configuration                                            3.2.0            30s

検証

VFIO ドライバーがロードされていることを確認します。

$ lspci -nnk -d 10de:

この出力では、VFIO ドライバーが使用されていることを確認します。

出力例

04:00.0 3D controller [0302]: NVIDIA Corporation GP102GL [Tesla P40] [10de:1eb8] (rev a1)
        Subsystem: NVIDIA Corporation Device [10de:1eb8]
        Kernel driver in use: vfio-pci
        Kernel modules: nouveau

8.15.10.1.3. CLI を使用したクラスターでの PCI ホストデバイスの公開
リンクのコピー

クラスターで PCI ホストデバイスを公開するには、PCI デバイスの詳細を HyperConverged カスタムリソース (CR) の spec.permittedHostDevices.pciHostDevices 配列に追加します。

手順

以下のコマンドを実行して、デフォルトエディターで HyperConverged CR を編集します。
```
$ oc edit hyperconverged kubevirt-hyperconverged -n openshift-cnv
```
PCI デバイス情報を spec.permittedHostDevices.pciHostDevices 配列に追加します。以下に例を示します。
設定ファイルのサンプル
```
apiVersion: hco.kubevirt.io/v1
kind: HyperConverged
metadata:
  name: kubevirt-hyperconverged
  namespace: openshift-cnv
spec:
  permittedHostDevices: 
```
1
```
    pciHostDevices: 
```
2
```
    - pciDeviceSelector: "10DE:1DB6" 
```
3
```
      resourceName: "nvidia.com/GV100GL_Tesla_V100" 
```
4
```
    - pciDeviceSelector: "10DE:1EB8"
      resourceName: "nvidia.com/TU104GL_Tesla_T4"
    - pciDeviceSelector: "8086:6F54"
      resourceName: "intel.com/qat"
      externalResourceProvider: true 
```
5
```
...
```
1
クラスターでの使用が許可されているホストデバイス。
2
ノードで利用可能な PCI デバイスの一覧。
3
PCI デバイスを識別するために必要な vendor-ID および device-ID。
4
PCI ホストデバイスの名前。
5
オプション: このフィールドを true に設定すると、リソースが外部デバイスプラグインにより提供されることを示します。OpenShift Virtualization はクラスターでこのデバイスの使用を許可しますが、割り当ておよびモニタリングを外部デバイスプラグインに残します。
注記
上記のスニペットの例は、nvidia.com/GV100GL_Tesla_V100 および nvidia.com/TU104GL_Tesla_T4 という名前の 2 つの PCI ホストデバイスが、HyperConverged CR の許可されたホストデバイスの一覧に追加されたことを示しています。これらのデバイスは、OpenShift Virtualization と動作することがテストおよび検証されています。
変更を保存し、エディターを終了します。

検証

以下のコマンドを実行して、PCI ホストデバイスがノードに追加されたことを確認します。この出力例は、各デバイスが nvidia.com/GV100GL_Tesla_V100、nvidia.com/TU104GL_Tesla_T4、および intel.com/qat のリソース名にそれぞれ関連付けられたデバイスが 1 つあることを示しています。

$ oc describe node <node_name>

出力例

Capacity:
  cpu:                            64
  devices.kubevirt.io/kvm:        110
  devices.kubevirt.io/tun:        110
  devices.kubevirt.io/vhost-net:  110
  ephemeral-storage:              915128Mi
  hugepages-1Gi:                  0
  hugepages-2Mi:                  0
  memory:                         131395264Ki
  nvidia.com/GV100GL_Tesla_V100   1
  nvidia.com/TU104GL_Tesla_T4     1
  intel.com/qat:                  1
  pods:                           250
Allocatable:
  cpu:                            63500m
  devices.kubevirt.io/kvm:        110
  devices.kubevirt.io/tun:        110
  devices.kubevirt.io/vhost-net:  110
  ephemeral-storage:              863623130526
  hugepages-1Gi:                  0
  hugepages-2Mi:                  0
  memory:                         130244288Ki
  nvidia.com/GV100GL_Tesla_V100   1
  nvidia.com/TU104GL_Tesla_T4     1
  intel.com/qat:                  1
  pods:                           250

8.15.10.1.4. CLI を使用したクラスターからの PCI ホストデバイスの削除
リンクのコピー

クラスターから PCI ホストデバイスを削除するには、HyperConverged カスタムリソース (CR) からそのデバイスの情報を削除します。

手順

以下のコマンドを実行して、デフォルトエディターで HyperConverged CR を編集します。
```
$ oc edit hyperconverged kubevirt-hyperconverged -n openshift-cnv
```

適切なデバイスの pciDeviceSelector、resourceName、および externalResourceProvider (該当する場合) のフィールドを削除して、spec.permittedHostDevices.pciHostDevices 配列から PCI デバイス情報を削除します。この例では、intel.com/qat リソースが削除されました。

設定ファイルのサンプル

apiVersion: hco.kubevirt.io/v1
kind: HyperConverged
metadata:
  name: kubevirt-hyperconverged
  namespace: openshift-cnv
spec:
  permittedHostDevices:
    pciHostDevices:
    - pciDeviceSelector: "10DE:1DB6"
      resourceName: "nvidia.com/GV100GL_Tesla_V100"
    - pciDeviceSelector: "10DE:1EB8"
      resourceName: "nvidia.com/TU104GL_Tesla_T4"
...

変更を保存し、エディターを終了します。

検証

以下のコマンドを実行して、PCI ホストデバイスがノードから削除されたことを確認します。この出力例は、intel.com/qat リソース名に関連付けられているデバイスがゼロであることを示しています。

$ oc describe node <node_name>

出力例

Capacity:
  cpu:                            64
  devices.kubevirt.io/kvm:        110
  devices.kubevirt.io/tun:        110
  devices.kubevirt.io/vhost-net:  110
  ephemeral-storage:              915128Mi
  hugepages-1Gi:                  0
  hugepages-2Mi:                  0
  memory:                         131395264Ki
  nvidia.com/GV100GL_Tesla_V100   1
  nvidia.com/TU104GL_Tesla_T4     1
  intel.com/qat:                  0
  pods:                           250
Allocatable:
  cpu:                            63500m
  devices.kubevirt.io/kvm:        110
  devices.kubevirt.io/tun:        110
  devices.kubevirt.io/vhost-net:  110
  ephemeral-storage:              863623130526
  hugepages-1Gi:                  0
  hugepages-2Mi:                  0
  memory:                         130244288Ki
  nvidia.com/GV100GL_Tesla_V100   1
  nvidia.com/TU104GL_Tesla_T4     1
  intel.com/qat:                  0
  pods:                           250

8.15.10.2. PCI パススルー用の仮想マシンの設定
リンクのコピー

PCI デバイスがクラスターに追加された後に、それらを仮想マシンに割り当てることができます。PCI デバイスが仮想マシンに物理的に接続されているかのような状態で利用できるようになりました。

8.15.10.2.1. PCI デバイスの仮想マシンへの割り当て
リンクのコピー

PCI デバイスがクラスターで利用可能な場合、これを仮想マシンに割り当て、PCI パススルーを有効にすることができます。

手順

PCI デバイスをホストデバイスとして仮想マシンに割り当てます。
例
```
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  domain:
    devices:
      hostDevices:
      - deviceName: nvidia.com/TU104GL_Tesla_T4 
```
1
```
        name: hostdevices1
```
1
クラスターでホストデバイスとして許可される PCI デバイスの名前。仮想マシンがこのホストデバイスにアクセスできます。

検証

以下のコマンドを使用して、ホストデバイスが仮想マシンから利用可能であることを確認します。
```
$ lspci -nnk | grep NVIDIA
```
出力例
```
$ 02:01.0 3D controller [0302]: NVIDIA Corporation GV100GL [Tesla V100 PCIe 32GB] [10de:1eb8] (rev a1)
```

8.15.11. 仮想 GPU パススルーの設定
リンクのコピー

仮想マシンは仮想 GPU (vGPU) ハードウェアにアクセスできます。仮想マシンに仮想 GPU を割り当てると、次のことが可能になります。

基盤となるハードウェアの GPU の一部にアクセスして、仮想マシンで高いパフォーマンスのメリットを実現する。
リソースを大量に消費する I/O 操作を合理化する。

重要

仮想 GPU パススルーは、ベアメタル環境で実行されているクラスターに接続されているデバイスにのみ割り当てることができます。

8.15.11.1. 仮想マシンへの vGPU パススルーデバイスの割り当て
リンクのコピー

Open Shift Container Platform Web コンソールを使用して、vGPU パススルーデバイスを仮想マシンに割り当てます。

前提条件

仮想マシンを停止する必要があります。

手順

Open Shift Container Platform Web コンソールで、サイドメニューから Virtualization VirtualMachines をクリックします。
デバイスを割り当てる仮想マシンを選択します。
Details タブで、GPU devices をクリックします。
vGPU デバイスをホストデバイスとして追加すると、VNC コンソールでデバイスにアクセスすることはできません。
Add GPU device をクリックし、Name を入力して、Device name リストからデバイスを選択します。
Save をクリックします。
YAMLタブをクリックして、クラスター設定の hostDevicesセクションに新しいデバイスが追加されていることを確認します。

注記

カスタマイズされたテンプレートまたは YAML ファイルから作成された仮想マシンに、ハードウェアデバイスを追加できます。Windows 10 や RHEL 7 などの特定のオペレーティングシステム用に事前に提供されているブートソーステンプレートにデバイスを追加することはできません。

クラスターに接続されているリソースを表示するには、サイドメニューから Compute Hardware Devices をクリックします。

8.15.12. 仲介デバイスの設定
リンクのコピー

HyperConvergedカスタムリソース (CR) でデバイスのリストを提供すると、Open Shift Virtualization は仮想 GPU (vGPU) などの仲介デバイスを自動的に作成します。

重要

仲介デバイスの宣言型設定は、テクノロジープレビュー機能としてのみ提供されます。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行いフィードバックを提供していただくことを目的としています。

Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲を参照してください。

8.15.12.1. NVIDIA GPU Operator の使用について
リンクのコピー

NVIDIA GPU Operator は、OpenShift Container Platform クラスターで NVIDIA GPU リソースを管理し、GPU ノードのブートストラップに関連するタスクを自動化します。GPU はクラスター内の特別なリソースであるため、アプリケーションワークロードを GPU にデプロイする前に、いくつかのコンポーネントをインストールする必要があります。これらのコンポーネントには、コンピューティングユニファイドデバイスアーキテクチャー (CUDA)、Kubernetes デバイスプラグイン、コンテナーランタイム、および自動ノードラベル付け、監視などを可能にする NVIDIA ドライバーが含まれます。

注記

NVIDIA GPU Operator は、NVIDIA によってのみサポートされています。NVIDIA からサポートを受ける方法は、Obtaining Support from NVIDIA を参照してください。

OpenShift Container Platform OpenShift Virtualization で GPU を有効にする方法は、OpenShift Container Platform ネイティブの方法と、NVIDIA GPU Operator を使用する方法の 2 つあります。ここでは、OpenShift Container Platform ネイティブの方法を説明します。

NVIDIA GPU Operator は、OpenShift Container Platform OpenShift Virtualization が GPU を OpenShift Container Platform で実行されている仮想化されたワークロードに公開できるようにする Kubernetes Operator です。これにより、ユーザーは GPU 対応の仮想マシンを簡単にプロビジョニングおよび管理できるようになり、他のワークロードと同じプラットフォームで複雑な人工知能/機械学習 (AI/ML) ワークロードを実行できるようになります。また、インフラストラクチャーの GPU 容量を簡単にスケーリングできるようになり、GPU ベースのワークロードが急激に増加しても対応できます。

NVIDIA GPU Operator を使用して、GPU で高速化された VM を実行するためのワーカーノードをプロビジョニングする方法の詳細は、NVIDIA GPU Operator with OpenShift Virtualization を参照してください。

8.15.12.2. OpenShift Virtualization での仮想 GPU の使用について
リンクのコピー

一部のグラフィックス処理ユニット (GPU) カードは、仮想 GPU (vGPU) の作成をサポートしています。管理者がHyperConvergedカスタムリソース (CR) で設定の詳細を提供すると、Open Shift Virtualization は仮想 GPU およびその他の仲介デバイスを自動的に作成できます。この自動化は、大規模なクラスターで特に役立ちます。

注記

機能とサポートの詳細については、ハードウェアベンダーのドキュメントを参照してください。

仲介デバイス: 1 つまたは複数の仮想デバイスに分割された物理デバイス。仮想 GPU は、仲介デバイス (mdev) の一種です。物理 GPU のパフォーマンスが、仮想デバイス間で分割されます。仲介デバイスを 1 つまたは複数の仮想マシン (VM) に割り当てることができますが、ゲストの数は GPU と互換性がある必要があります。一部の GPU は複数のゲストをサポートしていません。

8.15.12.2.1. 前提条件
リンクのコピー

ハードウェアベンダーがドライバーを提供している場合は、仲介デバイスを作成するノードにドライバーをインストールしている。
- NVIDIA カードを使用する場合は、NVIDIAGRID ドライバーをインストールしている。

8.15.12.2.2. 設定の概要
リンクのコピー

仲介デバイスを設定する場合、管理者は次のタスクを完了する必要があります。

仲介デバイスを作成する。
仲介デバイスをクラスターに公開する。

HyperConverged CR には、両方のタスクを実行する API が含まれています。

仲介デバイスの作成

...
spec:
  mediatedDevicesConfiguration:
    mediatedDevicesTypes:

1


    - <device_type>
    nodeMediatedDeviceTypes:

2


    - mediatedDevicesTypes:

3


      - <device_type>
      nodeSelector:

4


        <node_selector_key>: <node_selector_value>
...

1: 必須: クラスターのグローバル設定を定義します。
2: オプション: 特定のノードまたはノードのグループのグローバル設定をオーバーライドします。グローバルの mediatedDevicesTypes 設定と併用する必要があります。
3: nodeMediatedDeviceTypes を使用する場合に必須です。指定されたノードのグローバル MediedDevicesTypes 設定をオーバーライドします。
4: nodeMediatedDeviceTypes を使用する場合に必須です。key:value ペアを含める必要があります。

仲介デバイスのクラスターへの公開

...
  permittedHostDevices:
    mediatedDevices:
    - mdevNameSelector: GRID T4-2Q

1


      resourceName: nvidia.com/GRID_T4-2Q

2

...

1

この値にマッピングする仲介デバイスをホスト上に公開します。

注記

実際のシステムの正しい値に置き換えて、/sys/bus/pci/devices/<slot>:<bus>:<domain>.<function>/mdev_supported_types/<type>/name の内容を表示し、デバイスがサポートする仲介デバイスのタイプを確認できます。

たとえば、nvidia-231 タイプの name ファイルには、セレクター文字列 GRID T4-2Q が含まれます。GRID T4-2Q を mdevNameSelector 値として使用することで、ノードは nvidia-231 タイプを使用できます。

2

resourceName は、ノードに割り当てられたものと一致する必要があります。次のコマンドを使用して、resourceName を検索します。

$ oc get $NODE -o json \
  | jq '.status.allocatable \
    | with_entries(select(.key | startswith("nvidia.com/"))) \
    | with_entries(select(.value != "0"))'

8.15.12.2.3. 仮想 GPU がノードに割り当てられる方法
リンクのコピー

物理デバイスごとに、OpenShift Virtualization は以下の値を設定します。

1 つの mdev タイプ。
選択した mdev タイプのインスタンスの最大数。

クラスターのアーキテクチャーは、デバイスの作成およびノードへの割り当て方法に影響します。

ノードごとに複数のカードを持つ大規模なクラスター

同様の仮想 GPU タイプに対応する複数のカードを持つノードでは、関連するデバイス種別がラウンドロビン方式で作成されます。以下に例を示します。

...
mediatedDevicesConfiguration:
  mediatedDevicesTypes:
  - nvidia-222
  - nvidia-228
  - nvidia-105
  - nvidia-108
...

このシナリオでは、各ノードに以下の仮想 GPU 種別に対応するカードが 2 つあります。

nvidia-105
...
nvidia-108
nvidia-217
nvidia-299
...

各ノードで、OpenShift Virtualization は以下の vGPU を作成します。

最初のカード上に nvidia-105 タイプの 16 の仮想 GPU
2 番目のカード上に nvidia-108 タイプの 2 つの仮想 GPU

1 つのノードに、要求された複数の仮想 GPU タイプをサポートするカードが 1 つある

OpenShift Virtualization は、mediatedDevicesTypes 一覧の最初のサポートされるタイプを使用します。

たとえば、ノードカードのカードは nvidia-223 と nvidia-224 をサポートします。以下の mediatedDevicesTypes 一覧が設定されます。

...
mediatedDevicesConfiguration:
  mediatedDevicesTypes:
  - nvidia-22
  - nvidia-223
  - nvidia-224
...

この例では、OpenShift Virtualization は nvidia-223 タイプを使用します。

8.15.12.2.4. 仲介デバイスの変更および削除について
リンクのコピー

クラスターの仲介デバイス設定は、次の方法を使用して OpenShift Virtualization で更新できます。

HyperConverged CR を編集し、mediadDevicesTypes スタンザの内容を変更します。
nodeMediatedDeviceTypes ノードセレクターに一致するノードラベルを変更します。
HyperConverged CR の spec.mediaDevicesConfiguration および spec.permittedHostDevices スタンザからデバイス情報を削除します。
注記
spec.permittedHostDevices スタンザからデバイス情報を削除したが、spec.mediatedDevicesConfiguration スタンザからは削除しなかった場合、同じノードで新規の仲介デバイスタイプを作成することはできません。仲介デバイスを適切に削除するには、両方のスタンザからデバイス情報を削除します。

具体的な変更に応じて、これらのアクションにより、OpenShift Virtualization は仲介デバイスを再設定するか、クラスターノードからそれらを削除します。

8.15.12.2.5. 仲介デバイス用のホストの準備
リンクのコピー

仲介デバイスを設定する前に、入出力メモリー管理ユニット (IOMMU) ドライバーを有効にする必要があります。

8.15.12.2.5.1. IOMMU ドライバーを有効にするためのカーネル引数の追加
リンクのコピー

カーネルの IOMMU (Input-Output Memory Management Unit) ドライバーを有効にするには、MachineConfig オブジェクトを作成し、カーネル引数を追加します。

前提条件

作業用の OpenShift Container Platform クラスターに対する管理者権限が必要です。
Intel または AMD CPU ハードウェア。
Intel Virtualization Technology for Directed I/O 拡張または BIOS (Basic Input/Output System) の AMD IOMMU が有効にされている。

手順

カーネル引数を識別する MachineConfig オブジェクトを作成します。以下の例は、Intel CPU のカーネル引数を示しています。
```
apiVersion: machineconfiguration.openshift.io/v1
kind: MachineConfig
metadata:
  labels:
    machineconfiguration.openshift.io/role: worker 
```
1
```
  name: 100-worker-iommu 
```
2
```
spec:
  config:
    ignition:
      version: 3.2.0
  kernelArguments:
      - intel_iommu=on 
```
3
```
...
```
1
新しいカーネル引数をワーカーノードのみに適用します。
2
name は、マシン設定とその目的におけるこのカーネル引数 (100) のランクを示します。AMD CPU がある場合は、カーネル引数を amd_iommu=on として指定します。
3
Intel CPU の intel_iommu としてカーネル引数を特定します。
新規 MachineConfig オブジェクトを作成します。
```
$ oc create -f 100-worker-kernel-arg-iommu.yaml
```

検証

新規 MachineConfig オブジェクトが追加されていることを確認します。
```
$ oc get MachineConfig
```

8.15.12.2.6. 仲介デバイスの追加および削除
リンクのコピー

仲介デバイスを追加または削除できます。

8.15.12.2.6.1. 仲介デバイスの作成および公開
リンクのコピー

HyperConverged カスタムリソース (CR) を編集して、仮想 GPU (vGPU) などの仲介デバイスを公開し、作成できます。

前提条件

IOMMU (Input-Output Memory Management Unit) ドライバーを有効にしている。

手順

以下のコマンドを実行して、デフォルトエディターで HyperConverged CR を編集します。
```
$ oc edit hyperconverged kubevirt-hyperconverged -n openshift-cnv
```

仲介デバイス情報を HyperConverged CR のspec に追加し、mediatedDevicesConfiguration および permittedHostDevices スタンザが含まれるようにします。以下に例を示します。

設定ファイルのサンプル

apiVersion: hco.kubevirt.io/v1
kind: HyperConverged
metadata:
  name: kubevirt-hyperconverged
  namespace: openshift-cnv
spec:
  mediatedDevicesConfiguration: <.>
    mediatedDevicesTypes: <.>
    - nvidia-231
    nodeMediatedDeviceTypes: <.>
    - mediatedDevicesTypes: <.>
      - nvidia-233
      nodeSelector:
        kubernetes.io/hostname: node-11.redhat.com
  permittedHostDevices: <.>
    mediatedDevices:
    - mdevNameSelector: GRID T4-2Q
      resourceName: nvidia.com/GRID_T4-2Q
    - mdevNameSelector: GRID T4-8Q
      resourceName: nvidia.com/GRID_T4-8Q
...

<.> 仲介デバイスを作成します。<.> 必須: グローバル MediedDevicesTypes 設定。<.> 任意: 特定のノードのグローバル設定をオーバーライドします。<.> nodeMediatedDeviceTypes を使用する場合は必須。<.> 仲介デバイスをクラスターに公開します。

変更を保存し、エディターを終了します。

検証

以下のコマンドを実行して、デバイスが特定のノードに追加されたことを確認できます。
```
$ oc describe node <node_name>
```

8.15.12.2.6.2. CLI を使用したクラスターからの仲介デバイスの削除
リンクのコピー

クラスターから仲介デバイスを削除するには、HyperConverged カスタムリソース (CR) からそのデバイスの情報を削除します。

手順

以下のコマンドを実行して、デフォルトエディターで HyperConverged CR を編集します。
```
$ oc edit hyperconverged kubevirt-hyperconverged -n openshift-cnv
```
HyperConverged CR の spec.mediatedDevicesConfiguration および spec.permittedHostDevices スタンザからデバイス情報を削除します。両方のエントリーを削除すると、後で同じノードで新しい仲介デバイスタイプを作成できます。以下に例を示します。
設定ファイルのサンプル
```
apiVersion: hco.kubevirt.io/v1
kind: HyperConverged
metadata:
  name: kubevirt-hyperconverged
  namespace: openshift-cnv
spec:
  mediatedDevicesConfiguration:
    mediatedDevicesTypes: 
```
1
```
      - nvidia-231
  permittedHostDevices:
    mediatedDevices: 
```
2
```
    - mdevNameSelector: GRID T4-2Q
      resourceName: nvidia.com/GRID_T4-2Q
```
1
nvidia-231 デバイスタイプを削除するには、これを mediatedDevicesTypes 配列から削除します。
2
GRID T4-2Q デバイスを削除するには、mdevNameSelector フィールドおよび対応する resourceName フィールドを削除します。
変更を保存し、エディターを終了します。

8.15.12.3. 仲介デバイスの使用
リンクのコピー

vGPU は仲介デバイスの一種です。物理 GPU のパフォーマンスは仮想デバイス間で分割されます。仲介デバイスを 1 つ以上の仮想マシンに割り当てることができます。

8.15.12.3.1. 仮想マシンへの仲介デバイスの割り当て
リンクのコピー

仮想 GPU (vGPU) などの仲介デバイスを仮想マシンに割り当てます。

前提条件

仲介デバイスが HyperConverged カスタムリソースで設定されている。

手順

VirtualMachine マニフェストの spec.domain.devices.gpus スタンザを編集して、仲介デバイスを仮想マシン (VM) に割り当てます。
仮想マシンマニフェストの例
```
apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  domain:
    devices:
      gpus:
      - deviceName: nvidia.com/TU104GL_Tesla_T4 
```
1
```
        name: gpu1 
```
2
```
      - deviceName: nvidia.com/GRID_T4-1Q
        name: gpu2
```
1
仲介デバイスに関連付けられたリソース名。
2
仮想マシン上のデバイスを識別する名前。

検証

デバイスが仮想マシンで利用できることを確認するには、<device_name> を VirtualMachine マニフェストの deviceName の値に置き換えて以下のコマンドを実行します。
```
$ lspci -nnk | grep <device_name>
```

8.15.13. ウォッチドッグの設定
リンクのコピー

ウォッチドッグデバイスに仮想マシン (VM) を設定し、ウォッチドッグをインストールして、ウォッチドッグサービスを開始することで、ウォッチドッグを公開します。

8.15.13.1. 前提条件
リンクのコピー

仮想マシンで i6300esb ウォッチドッグデバイスのカーネルサポートが含まれている。Red Hat Enterprise Linux(RHEL) イメージが、i6300esb をサポートしている。

8.15.13.2. ウォッチドッグデバイスの定義
リンクのコピー

オペレーティングシステム (OS) が応答しなくなるときにウォッチドッグがどのように進行するかを定義します。

表8.4 利用可能なアクション

`poweroff`	仮想マシン (VM) の電源がすぐにオフになります。`spec.running` が `true` に設定されている場合や、`spec.runStrategy` が `manual` に設定されていない場合には、仮想マシンは再起動します。
`reset`	VM はその場で再起動し、ゲスト OS は反応できません。ゲスト OS の再起動に必要な時間の長さにより liveness プローブのタイムアウトが生じる可能性があるため、このオプションの使用は推奨されません。このタイムアウトにより、クラスターレベルの保護が liveness プローブの失敗に気づき、強制的に再スケジュールした場合に、VM の再起動にかかる時間が長くなる可能性があります。
`shutdown`	VM は、すべてのサービスを停止することにより、正常に電源を切ります。

手順

以下の内容を含む YAML ファイルを作成します。

apiVersion: kubevirt.io/v1
kind: VirtualMachine
metadata:
  labels:
    kubevirt.io/vm: vm2-rhel84-watchdog
  name: <vm-name>
spec:
  running: false
  template:
    metadata:
     labels:
        kubevirt.io/vm: vm2-rhel84-watchdog
    spec:
      domain:
        devices:
          watchdog:
            name: <watchdog>
            i6300esb:
              action: "poweroff"

1

...

1: watchdog アクション (poweroff、reset、または shutdown) を指定します。

上記の例では、電源オフアクションを使用して、RHEL8 VM で i6300esb ウォッチドッグデバイスを設定し、デバイスを /dev/watchdog として公開します。

このデバイスは、ウォッチドッグバイナリーで使用できるようになりました。

以下のコマンドを実行して、YAML ファイルをクラスターに適用します。
```
$ oc apply -f <file_name>.yaml
```

重要

この手順は、ウォッチドッグ機能をテストするためにのみ提供されており、実稼働マシンでは実行しないでください。

以下のコマンドを実行して、VM がウォッチドッグデバイスに接続されていることを確認します。
```
$ lspci | grep watchdog -i
```
以下のコマンドのいずれかを実行して、ウォッチドッグがアクティブであることを確認します。
- カーネルパニックをトリガーします。
  # echo c > /proc/sysrq-trigger
- ウォッチドッグサービスを終了します。
  # pkill -9 watchdog

8.15.13.3. ウォッチドッグデバイスのインストール
リンクのコピー

仮想マシンに watchdog パッケージをインストールして、ウォッチドッグサービスを起動します。

手順

root ユーザーとして、watchdog パッケージおよび依存関係をインストールします。
```
# yum install watchdog
```
/etc/watchdog.conf ファイルの以下の行のコメントを解除して、変更を保存します。
```
#watchdog-device = /dev/watchdog
```
ウォッチドッグサービスが起動時に開始できるように有効化します。
```
# systemctl enable --now watchdog.service
```

8.15.14. 事前定義済みのブートソースの自動インポートおよび更新
リンクのコピー

システム定義 で OpenShift Virtualization に含まれるブートソース、または作成した ユーザー定義 のブートソースを使用できます。システム定義のブートソースのインポートおよび更新は、製品の機能ゲートによって制御されます。機能ゲートを使用して、更新を有効、無効、または再度有効にすることができます。ユーザー定義のブートソースは、製品機能ゲートによって制御されないため、自動インポートおよび更新をオプトインまたはオプトアウトするには、個別に管理する必要があります。

重要

ブートソースの自動インポートおよび更新のために、デフォルトのストレージクラスを設定する必要があります。

8.15.14.1. ブートソースの自動更新の有効化
リンクのコピー

OpenShift Virtualization 4.9 からの事前定義済みのブートソースがある場合は、手動でブートソースの自動更新を選択する必要があります。OpenShift Virtualization 4.10 以降からのすべての事前定義済みブートソースは、デフォルトで自動的に更新されます。

手順

以下のコマンドを使用して dataImportCron ラベルをデータソースに適用します。

$ oc label --overwrite DataSource rhel8 -n openshift-virtualization-os-images cdi.kubevirt.io/dataImportCron=true

8.15.14.2. ブートソースの自動更新の無効化
リンクのコピー

非接続環境のログ数を減らしたり、リソースの使用量を減らしたりできます。そのためには、事前定義済みブートソースの自動インポートと更新を無効にします。HyperConverged カスタムリソース (CR) の spec.featureGates.enableCommonBootImageImport フィールドを false に設定します。

注記

カスタムブートソースは、この設定の影響を受けません。

手順

以下のコマンドを使用して自動更新を無効にします。

$ oc patch hco kubevirt-hyperconverged -n openshift-cnv --type json -p '[{"op": "replace", "path": "/spec/featureGates/enableCommonBootImageImport", "value": false}]'

8.15.14.3. ブートソースの自動更新の再有効化
リンクのコピー

以前にブートソースの自動更新を無効にしている場合は、この機能を手動で再度有効にする必要があります。HyperConverged カスタムリソース (CR) の spec.featureGates.enableCommonBootImageImport フィールドを true に設定します。

手順

以下のコマンドを使用して自動更新を再度有効にします。

$ oc patch hco kubevirt-hyperconverged -n openshift-cnv --type json -p '[{"op": "replace", "path": "/spec/featureGates/enableCommonBootImageImport", "value": true}]'

8.15.14.4. カスタムブートソースでの自動更新の有効化
リンクのコピー

OpenShift Virtualization はデフォルトで事前に定義されたブートソースを自動的に更新しますが、カスタムブートソースは自動的に更新しません。HyperConverged カスタムリソース (CR) を編集して、カスタムブートソースで自動インポートおよび更新を手動で有効にする必要があります。

手順

以下のコマンドを使用して、編集するために HyperConverged CR を開きます。
```
$ oc edit -n openshift-cnv HyperConverged
```
適切なテンプレートおよびブートソースを dataImportCronTemplates セクションで指定して、HyperConverged CR を編集します。以下に例を示します。
CentOS 7 の例
```
apiVersion: hco.kubevirt.io/v1beta1
kind: HyperConverged
metadata:
  name: kubevirt-hyperconverged
spec:
  dataImportCronTemplates:
  - metadata:
      name: centos7-image-cron
      annotations:
        cdi.kubevirt.io/storage.bind.immediate.requested: "true" 
```
1
```
    spec:
      schedule: "0 */12 * * *" 
```
2
```
      template:
        spec:
          source:
            registry: 
```
3
```
              url: docker://quay.io/containerdisks/centos:7-2009
          storage:
            resources:
              requests:
                storage: 10Gi
      managedDataSource: centos7 
```
4
```
      retentionPolicy: "None" 
```
5
1
このアノテーションは、volumeBindingMode が WaitForFirstConsumer に設定されたストレージクラスに必要です。
2
cron 形式で指定されるジョブのスケジュール。
3
レジストリーソースからデータボリュームを作成するのに使用します。node docker キャッシュに基づくデフォルトの node pullMethod ではなく、デフォルトの pod pullMethod を使用します。node docker キャッシュはレジストリーイメージがContainer.Image で利用可能な場合に便利ですが、CDI インポーターはこれにアクセスすることは許可されていません。
4
利用可能なブートソースとして検出するカスタムイメージの場合、イメージの managedDataSource の名前が、仮想マシンテンプレート YAML ファイルの spec.dataVolumeTemplates.spec.sourceRef.name にあるテンプレートの DataSource の名前に一致する必要があります。
5
cron ジョブが削除されたときにデータボリュームおよびデータソースを保持するには、All を使用します。cron ジョブが削除されたときにデータボリュームおよびデータソースを削除するには、None を使用します。

8.15.15. 仮想マシンでの Descheduler エビクションの有効化
リンクのコピー

Descheduler を使用して Pod を削除し、Pod をより適切なノードに再スケジュールできます。Pod が仮想マシンの場合、Pod の削除により、仮想マシンが別のノードにライブマイグレーションされます。

重要

仮想マシンの Descheduler エビクションはテクノロジープレビュー機能としてのみご利用いただけます。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行いフィードバックを提供していただくことを目的としています。

Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲を参照してください。

8.15.15.1. Descheduler プロファイル
リンクのコピー

テクノロジープレビューの DevPreviewLongLifecycle プロファイルを使用して、仮想マシンで Descheduler を有効にします。これは、現在 OpenShift Virtualization で利用可能な唯一の Descheduler プロファイルです。適切なスケジューリングを確保するには、予想される負荷に応じた CPU およびメモリー要求で仮想マシンを作成します。

DevPreviewLongLifecycle

このプロファイルは、ノード間のリソース使用率のバランスを取り、以下のストラテジーを有効にします。

RemovePodsHavingTooManyRestarts: コンテナーが何度も再起動された Pod、およびすべてのコンテナー (Init コンテナーを含む) の再起動の合計が 100 を超える Pod を削除します。仮想マシンのゲストオペレーティングシステムを再起動しても、この数は増えません。
LowNodeUtilization: 使用率の低いノードがある場合に、使用率の高いノードから Pod をエビクトします。エビクトされた Pod の宛先ノードはスケジューラーによって決定されます。
- ノードは、使用率がすべてのしきい値 (CPU、メモリー、Pod の数) について 20% 未満の場合に使用率が低いと見なされます。
- ノードは、使用率がすべてのしきい値 (CPU、メモリー、Pod の数) について 50% を超える場合に過剰に使用されていると見なされます。

8.15.15.2. Descheduler のインストール
リンクのコピー

Descheduler はデフォルトで利用できません。Descheduler を有効にするには、Kube Descheduler Operator を OperatorHub からインストールし、1 つ以上の Descheduler プロファイルを有効にする必要があります。

前提条件

クラスター管理者の権限。
OpenShift Container Platform Web コンソールにアクセスします。

手順

OpenShift Container Platform Web コンソールにログインします。
Kube Descheduler Operator に必要な namespace を作成します。
1. Administration Namespaces に移動し、Create Namespace をクリックします。
2. Name フィールドに openshift-kube-descheduler-operator を入力し、Labels フィールドに openshift.io/cluster-monitoring=true を入力して Descheduler メトリックを有効にし、Create をクリックします。
Kube Descheduler Operator をインストールします。
1. Operators OperatorHub に移動します。
2. Kube Descheduler Operator をフィルターボックスに入力します。
3. Kube Descheduler Operator を選択し、Install をクリックします。
4. Install Operator ページで、A specific namespace on the cluster を選択します。ドロップダウンメニューから openshift-kube-descheduler-operator を選択します。
5. Update Channel および Approval Strategy の値を必要な値に調整します。
6. Install をクリックします。
Descheduler インスタンスを作成します。
1. Operators Installed Operators ページから、 Kube Descheduler Operator をクリックします。
2. Kube Descheduler タブを選択し、Create KubeDescheduler をクリックします。
3. 必要に応じて設定を編集します。
  1. Profiles セクションを展開し、DevPreviewLongLifecycle を選択します。AffinityAndTaints プロファイルがデフォルトで有効になっています。
    重要
    OpenShift Virtualization で現在利用できるプロファイルは DevPreviewLongLifecycle のみです。

また、後で OpenShift CLI (oc) を使用して、Descheduler のプロファイルおよび設定を設定することもできます。

8.15.15.3. 仮想マシン (VM) での Descheduler エビクションの有効化
リンクのコピー

Descheduler のインストール後に、アノテーションを VirtualMachine カスタムリソース (CR) に追加して Descheduler エビクションを仮想マシンで有効にできます。

前提条件

Descheduler を OpenShift Container Platform Web コンソールまたは OpenShift CLI (oc) にインストールしている。
仮想マシンが実行されていないことを確認します。

手順

仮想マシンを起動する前に、Descheduler.alpha.kubernetes.io/evict アノテーションを VirtualMachine CR に追加します。

apiVersion: kubevirt.io/v1
kind: VirtualMachine
spec:
  template:
    metadata:
      annotations:
        descheduler.alpha.kubernetes.io/evict: "true"

インストール時に Web コンソールで DevPreviewLongLifecycle プロファイルをまだ設定していない場合は、KubeDescheduler オブジェクトの spec.profile セクションに DevPreviewLongLifecycle を指定します。
```
apiVersion: operator.openshift.io/v1
kind: KubeDescheduler
metadata:
  name: cluster
  namespace: openshift-kube-descheduler-operator
spec:
  deschedulingIntervalSeconds: 3600
  profiles:
  - DevPreviewLongLifecycle
```

Descheduler が仮想マシンで有効になりました。

8.15.1. 仮想マシンのリソースクォータの使用リンクのコピーリンクがクリップボードにコピーされました!

8.15.1.1. 仮想マシンのリソースクォータ制限の設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.2. 仮想マシンのノードの指定リンクのコピーリンクがクリップボードにコピーされました!

8.15.2.1. 仮想マシンのノード配置についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.2.2. ノード配置の例リンクのコピーリンクがクリップボードにコピーされました!

8.15.2.2.1. 例: nodeSelector を使用した仮想マシンノードの配置リンクのコピーリンクがクリップボードにコピーされました!

8.15.2.2.2. 例: Pod のアフィニティーおよび Pod の非アフィニティーによる仮想マシンノードの配置リンクのコピーリンクがクリップボードにコピーされました!

8.15.2.2.3. 例: ノードのアフィニティーによる仮想マシンノードの配置リンクのコピーリンクがクリップボードにコピーされました!

8.15.2.2.4. 例: 容認 (toleration) を使用した仮想マシンノードの配置リンクのコピーリンクがクリップボードにコピーされました!

8.15.3. 証明書ローテーションの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.3.1. 証明書ローテーションの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.3.2. 証明書ローテーションパラメーターのトラブルシューティングリンクのコピーリンクがクリップボードにコピーされました!

8.15.4. 管理タスクの自動化リンクのコピーリンクがクリップボードにコピーされました!

8.15.4.1. Red Hat Ansible Automation についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.4.2. 仮想マシン作成の自動化リンクのコピーリンクがクリップボードにコピーされました!

8.15.4.3. 例: 仮想マシンを作成するための Ansible Playbookリンクのコピーリンクがクリップボードにコピーされました!

8.15.5. 仮想マシンに UEFI モードを使用するリンクのコピーリンクがクリップボードにコピーされました!

8.15.5.1. 仮想マシンの UEFI モードについてリンクのコピーリンクがクリップボードにコピーされました!

8.15.5.2. UEFI モードでの仮想マシンの起動リンクのコピーリンクがクリップボードにコピーされました!

8.15.6. 仮想マシンの PXE ブートの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.6.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

8.15.6.2. MAC アドレスを指定した PXE ブートリンクのコピーリンクがクリップボードにコピーされました!

8.15.6.3. OpenShift Virtualization ネットワークの用語集リンクのコピーリンクがクリップボードにコピーされました!

8.15.7. 仮想マシンでの Huge Page の使用リンクのコピーリンクがクリップボードにコピーされました!

8.15.7.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

8.15.7.2. Huge Page の機能リンクのコピーリンクがクリップボードにコピーされました!

8.15.7.3. 仮想マシンの Huge Page の設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.8. 仮想マシン用の専用リソースの有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.8.1. 専用リソースについてリンクのコピーリンクがクリップボードにコピーされました!

8.15.8.2. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

8.15.8.3. 仮想マシンの専用リソースの有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.9. 仮想マシンのスケジュールリンクのコピーリンクがクリップボードにコピーされました!

8.15.9.1. ポリシー属性リンクのコピーリンクがクリップボードにコピーされました!

8.15.9.2. ポリシー属性および CPU 機能の設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.9.3. サポートされている CPU モデルでの仮想マシンのスケジューリングリンクのコピーリンクがクリップボードにコピーされました!

8.15.9.4. ホストモデルでの仮想マシンのスケジューリングリンクのコピーリンクがクリップボードにコピーされました!

8.15.10. PCI パススルーの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.10.1. PCI パススルー用ホストデバイスの準備についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.10.1.1. IOMMU ドライバーを有効にするためのカーネル引数の追加リンクのコピーリンクがクリップボードにコピーされました!

8.15.10.1.2. PCI デバイスの VFIO ドライバーへのバインディングリンクのコピーリンクがクリップボードにコピーされました!

8.15.10.1.3. CLI を使用したクラスターでの PCI ホストデバイスの公開リンクのコピーリンクがクリップボードにコピーされました!

8.15.10.1.4. CLI を使用したクラスターからの PCI ホストデバイスの削除リンクのコピーリンクがクリップボードにコピーされました!

8.15.10.2. PCI パススルー用の仮想マシンの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.10.2.1. PCI デバイスの仮想マシンへの割り当てリンクのコピーリンクがクリップボードにコピーされました!

8.15.11. 仮想 GPU パススルーの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.11.1. 仮想マシンへの vGPU パススルーデバイスの割り当てリンクのコピーリンクがクリップボードにコピーされました!

8.15.12. 仲介デバイスの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.1. NVIDIA GPU Operator の使用についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2. OpenShift Virtualization での仮想 GPU の使用についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.2. 設定の概要リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.3. 仮想 GPU がノードに割り当てられる方法リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.4. 仲介デバイスの変更および削除についてリンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.5. 仲介デバイス用のホストの準備リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.5.1. IOMMU ドライバーを有効にするためのカーネル引数の追加リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.6. 仲介デバイスの追加および削除リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.6.1. 仲介デバイスの作成および公開リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.2.6.2. CLI を使用したクラスターからの仲介デバイスの削除リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.3. 仲介デバイスの使用リンクのコピーリンクがクリップボードにコピーされました!

8.15.12.3.1. 仮想マシンへの仲介デバイスの割り当てリンクのコピーリンクがクリップボードにコピーされました!

8.15.13. ウォッチドッグの設定リンクのコピーリンクがクリップボードにコピーされました!

8.15.13.1. 前提条件リンクのコピーリンクがクリップボードにコピーされました!

8.15.13.2. ウォッチドッグデバイスの定義リンクのコピーリンクがクリップボードにコピーされました!

8.15.13.3. ウォッチドッグデバイスのインストールリンクのコピーリンクがクリップボードにコピーされました!

8.15.14. 事前定義済みのブートソースの自動インポートおよび更新リンクのコピーリンクがクリップボードにコピーされました!

8.15.14.1. ブートソースの自動更新の有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.14.2. ブートソースの自動更新の無効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.14.3. ブートソースの自動更新の再有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.14.4. カスタムブートソースでの自動更新の有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.15. 仮想マシンでの Descheduler エビクションの有効化リンクのコピーリンクがクリップボードにコピーされました!

8.15.15.1. Descheduler プロファイルリンクのコピーリンクがクリップボードにコピーされました!

8.15.15.2. Descheduler のインストールリンクのコピーリンクがクリップボードにコピーされました!

8.15.15.3. 仮想マシン (VM) での Descheduler エビクションの有効化リンクのコピーリンクがクリップボードにコピーされました!

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

8.15.1. 仮想マシンのリソースクォータの使用
リンクのコピー

8.15.1.1. 仮想マシンのリソースクォータ制限の設定
リンクのコピー

8.15.2. 仮想マシンのノードの指定
リンクのコピー

8.15.2.1. 仮想マシンのノード配置について
リンクのコピー

8.15.2.2. ノード配置の例
リンクのコピー

8.15.2.2.1. 例: nodeSelector を使用した仮想マシンノードの配置
リンクのコピー

8.15.2.2.2. 例: Pod のアフィニティーおよび Pod の非アフィニティーによる仮想マシンノードの配置
リンクのコピー

8.15.2.2.3. 例: ノードのアフィニティーによる仮想マシンノードの配置
リンクのコピー

8.15.2.2.4. 例: 容認 (toleration) を使用した仮想マシンノードの配置
リンクのコピー

8.15.3. 証明書ローテーションの設定
リンクのコピー

8.15.3.1. 証明書ローテーションの設定
リンクのコピー

8.15.3.2. 証明書ローテーションパラメーターのトラブルシューティング
リンクのコピー

8.15.4. 管理タスクの自動化
リンクのコピー

8.15.4.1. Red Hat Ansible Automation について
リンクのコピー

8.15.4.2. 仮想マシン作成の自動化
リンクのコピー

8.15.4.3. 例: 仮想マシンを作成するための Ansible Playbook
リンクのコピー

8.15.5. 仮想マシンに UEFI モードを使用する
リンクのコピー

8.15.5.1. 仮想マシンの UEFI モードについて
リンクのコピー

8.15.5.2. UEFI モードでの仮想マシンの起動
リンクのコピー

8.15.6. 仮想マシンの PXE ブートの設定
リンクのコピー

8.15.6.1. 前提条件
リンクのコピー

8.15.6.2. MAC アドレスを指定した PXE ブート
リンクのコピー

8.15.6.3. OpenShift Virtualization ネットワークの用語集
リンクのコピー

8.15.7. 仮想マシンでの Huge Page の使用
リンクのコピー

8.15.7.1. 前提条件
リンクのコピー

8.15.7.2. Huge Page の機能
リンクのコピー

8.15.7.3. 仮想マシンの Huge Page の設定
リンクのコピー

8.15.8. 仮想マシン用の専用リソースの有効化
リンクのコピー

8.15.8.1. 専用リソースについて
リンクのコピー

8.15.8.2. 前提条件
リンクのコピー

8.15.8.3. 仮想マシンの専用リソースの有効化
リンクのコピー

8.15.9. 仮想マシンのスケジュール
リンクのコピー

8.15.9.1. ポリシー属性
リンクのコピー

8.15.9.2. ポリシー属性および CPU 機能の設定
リンクのコピー

8.15.9.3. サポートされている CPU モデルでの仮想マシンのスケジューリング
リンクのコピー

8.15.9.4. ホストモデルでの仮想マシンのスケジューリング
リンクのコピー

8.15.10. PCI パススルーの設定
リンクのコピー

8.15.10.1. PCI パススルー用ホストデバイスの準備について
リンクのコピー

8.15.10.1.1. IOMMU ドライバーを有効にするためのカーネル引数の追加
リンクのコピー

8.15.10.1.2. PCI デバイスの VFIO ドライバーへのバインディング
リンクのコピー

8.15.10.1.3. CLI を使用したクラスターでの PCI ホストデバイスの公開
リンクのコピー

8.15.10.1.4. CLI を使用したクラスターからの PCI ホストデバイスの削除
リンクのコピー

8.15.10.2. PCI パススルー用の仮想マシンの設定
リンクのコピー

8.15.10.2.1. PCI デバイスの仮想マシンへの割り当て
リンクのコピー

8.15.11. 仮想 GPU パススルーの設定
リンクのコピー

8.15.11.1. 仮想マシンへの vGPU パススルーデバイスの割り当て
リンクのコピー

8.15.12. 仲介デバイスの設定
リンクのコピー

8.15.12.1. NVIDIA GPU Operator の使用について
リンクのコピー

8.15.12.2. OpenShift Virtualization での仮想 GPU の使用について
リンクのコピー

8.15.12.2.1. 前提条件
リンクのコピー

8.15.12.2.2. 設定の概要
リンクのコピー

8.15.12.2.3. 仮想 GPU がノードに割り当てられる方法
リンクのコピー

8.15.12.2.4. 仲介デバイスの変更および削除について
リンクのコピー

8.15.12.2.5. 仲介デバイス用のホストの準備
リンクのコピー

8.15.12.2.5.1. IOMMU ドライバーを有効にするためのカーネル引数の追加
リンクのコピー

8.15.12.2.6. 仲介デバイスの追加および削除
リンクのコピー

8.15.12.2.6.1. 仲介デバイスの作成および公開
リンクのコピー

8.15.12.2.6.2. CLI を使用したクラスターからの仲介デバイスの削除
リンクのコピー

8.15.12.3. 仲介デバイスの使用
リンクのコピー

8.15.12.3.1. 仮想マシンへの仲介デバイスの割り当て
リンクのコピー

8.15.13. ウォッチドッグの設定
リンクのコピー

8.15.13.1. 前提条件
リンクのコピー

8.15.13.2. ウォッチドッグデバイスの定義
リンクのコピー

8.15.13.3. ウォッチドッグデバイスのインストール
リンクのコピー

8.15.14. 事前定義済みのブートソースの自動インポートおよび更新
リンクのコピー

8.15.14.1. ブートソースの自動更新の有効化
リンクのコピー

8.15.14.2. ブートソースの自動更新の無効化
リンクのコピー

8.15.14.3. ブートソースの自動更新の再有効化
リンクのコピー

8.15.14.4. カスタムブートソースでの自動更新の有効化
リンクのコピー

8.15.15. 仮想マシンでの Descheduler エビクションの有効化
リンクのコピー

8.15.15.1. Descheduler プロファイル
リンクのコピー

8.15.15.2. Descheduler のインストール
リンクのコピー

8.15.15.3. 仮想マシン (VM) での Descheduler エビクションの有効化
リンクのコピー