머신 관리
클러스터 머신 추가 및 유지 보수
초록
1장. 머신 관리 개요
머신 관리를 사용하여 AWS(Amazon Web Services), Microsoft Azure, GCP(Google Cloud Platform), RHOSP(Red Hat OpenStack Platform), RHV(Red Hat Virtualization), VMware vSphere와 같은 기본 인프라에서 OpenShift Container Platform 클러스터를 관리할 수 있습니다. 특정 워크로드 정책에 따라 클러스터를 제어하고 클러스터 확장 및 축소와 같은 자동 스케일링을 수행할 수 있습니다.
워크로드 변경에 맞게 클러스터를 갖는 것이 중요합니다. OpenShift Container Platform 클러스터는 로드가 증가하거나 줄어들 때 수평으로 확장 및 축소할 수 있습니다.
머신 관리는 CRD(사용자 정의 리소스 정의 )로 구현됩니다. CRD 오브젝트는 클러스터에서 새 고유 오브젝트 Kind
를 정의하고 Kubernetes API 서버에서 오브젝트의 전체 라이프사이클을 처리할 수 있도록 합니다.
Machine API Operator는 다음 리소스를 프로비저닝합니다.
-
MachineSet
-
머신
-
ClusterAutoscaler
-
MachineAutoscaler
-
MachineHealthCheck
1.1. Machine API 개요
Machine API는 업스트림 Cluster API 프로젝트 및 사용자 정의 OpenShift Container Platform 리소스를 기반으로 하는 주요 리소스의 조합입니다.
OpenShift Container Platform 4.13 클러스터의 경우 Machine API는 클러스터 설치가 완료된 후 모든 노드 호스트 프로비저닝 관리 작업을 수행합니다. 이 시스템으로 인해 OpenShift Container Platform 4.13은 퍼블릭 또는 프라이빗 클라우드 인프라에 더하여 탄력적이고 동적인 프로비저닝 방법을 제공합니다.
두 가지 주요 리소스는 다음과 같습니다.
- Machine
-
노드의 호스트를 설명하는 기본 단위입니다. 머신에는
providerSpec
사양이 있으며 이는 다른 클라우드 플랫폼에 제공되는 컴퓨팅 노드 유형을 설명합니다. 예를 들어 컴퓨팅 노드의 머신 유형은 특정 시스템 유형과 필수 메타데이터를 정의할 수 있습니다. - 머신 세트
MachineSet
리소스는 컴퓨팅 머신 그룹입니다. 컴퓨팅 머신 세트는 컴퓨팅 머신에 연관되어 있고 복제본 세트는 pod에 연관되어 있습니다. 더 많은 컴퓨팅 머신이 필요하거나 확장해야 하는 경우 컴퓨팅 요구 사항에 맞게MachineSet
리소스의replicas
필드를 변경합니다.주의컨트롤 플레인 시스템은 컴퓨팅 머신 세트로 관리할 수 없습니다.
컨트롤 플레인 머신 세트는 컴퓨팅 머신에 제공하는 컴퓨팅 머신 세트와 유사한 지원되는 컨트롤 플레인 시스템에 대한 관리 기능을 제공합니다.
자세한 내용은 "컨트롤 플레인 머신 관리"를 참조하십시오.
다음 사용자 지정 리소스는 클러스터에 더 많은 기능을 추가할 수 있습니다.
- 머신 자동 스케일러
MachineAutoscaler
리소스는 클라우드에서 컴퓨팅 머신을 자동으로 확장합니다. 지정된 컴퓨팅 머신 세트에서 노드의 최소 및 최대 스케일링 경계를 설정할 수 있으며 머신 자동 스케일러는 해당 노드 범위를 유지합니다.MachineAutoscaler
객체는ClusterAutoscaler
객체를 설정한 후에 사용할 수 있습니다.ClusterAutoscaler
및MachineAutoscaler
리소스는 모두ClusterAutoscalerOperator
오브젝트에서 사용 가능합니다.- Cluster autoscaler
이 리소스는 업스트림 클러스터 자동 스케일러 프로젝트를 기반으로 합니다. OpenShift Container Platform 구현에서는 컴퓨팅 머신 세트 API를 확장하여 Machine API와 통합됩니다. 클러스터 자동 스케일러를 사용하여 다음과 같은 방법으로 클러스터를 관리할 수 있습니다.
- 코어, 노드, 메모리, GPU와 같은 리소스에 대한 클러스터 전체 스케일링 제한을 설정합니다.
- 중요도가 낮은 Pod에 대해 클러스터가 Pod 및 새 노드가 온라인 상태가 되지 않도록 우선 순위를 설정합니다.
- 노드를 확장할 수는 있지만 축소할 수 없도록 스케일링 정책을 설정합니다.
- 머신 상태 점검
-
MachineHealthCheck
리소스는 머신의 비정상적인 상태를 감지하여 삭제한 후 지원되는 플랫폼에서 새 머신을 생성합니다.
OpenShift Container Platform 버전 3.11에서는 클러스터가 머신 프로비저닝을 관리하지 않았기 때문에 다중 영역 아키텍처를 쉽게 롤아웃할 수 없었습니다. OpenShift Container Platform 버전 4.1부터 이러한 프로세스가 더 쉬워졌습니다. 각 컴퓨팅 머신 세트의 범위는 단일 영역으로 지정되므로 설치 프로그램은 사용자를 대신하여 가용성 영역 전체에 컴퓨팅 머신 세트를 보냅니다. 또한 계산이 동적이고 영역 장애가 발생하여 머신을 재조정해야하는 경우 처리할 수 있는 영역을 확보할 수 있습니다. 여러 가용성 영역이 없는 글로벌 Azure 리전에서는 가용성 세트를 사용하여 고가용성을 보장할 수 있습니다. Autoscaler는 클러스터의 수명 기간 동안 최적의 균형을 유지합니다.
추가 리소스
1.2. 컴퓨팅 시스템 관리
클러스터 관리자는 다음 작업을 수행할 수 있습니다.
다음 클라우드 공급자의 컴퓨팅 머신 세트를 생성합니다.
- 베어 메탈 배포를 위한 머신 세트 생성: 베어 메탈에서 컴퓨팅 머신 세트생성
- 컴퓨팅 머신 세트에서 머신을 추가하거나 제거하여 컴퓨팅 머신 세트를 수동으로 확장합니다.
-
MachineSet
YAML 구성 파일을 통해 컴퓨팅 머신 세트를 수정합니다. - 머신을 삭제합니다.
- 인프라 컴퓨팅 머신 세트를 생성합니다.
- 머신 풀에서 손상된 머신을 자동으로 수정하도록 머신 상태 점검을 구성하고 배포합니다.
1.3. 컨트롤 플레인 시스템 관리
클러스터 관리자는 다음 작업을 수행할 수 있습니다.
다음 클라우드 공급자에 대한 컨트롤 플레인 머신 세트로 컨트롤 플레인 구성을 업데이트합니다.
- 머신 상태 점검을 구성하고 배포하여 비정상 컨트롤 플레인 시스템을 자동으로 복구합니다.
1.4. OpenShift Container Platform 클러스터에 자동 스케일링 적용
워크로드 변경을 위한 유연성을 보장하기 위해 OpenShift Container Platform 클러스터를 자동으로 확장할 수 있습니다. 클러스터를 자동 스케일링 하려면 먼저 클러스터 자동 스케일러를 배포한 다음 각 컴퓨팅 머신 세트의 머신 자동 스케일러를 배포해야 합니다.
- 클러스터 자동 스케일러 는 배포 요구 사항에 따라 클러스터 크기를 늘리고 줄입니다.
- 머신 자동 스케일러 는 OpenShift Container Platform 클러스터에 배포하는 컴퓨팅 머신 세트의 머신 수를 조정합니다.
1.5. 사용자 프로비저닝 인프라에 컴퓨팅 시스템 추가
사용자 프로비저닝 인프라는 OpenShift Container Platform을 호스팅하는 컴퓨팅, 네트워크 및 스토리지 리소스와 같은 인프라를 배포할 수 있는 환경입니다. 설치 프로세스 중 또는 설치 프로세스 후 사용자 프로비저닝 인프라의 클러스터에 컴퓨팅 머신을 추가할 수 있습니다.
1.6. 클러스터에 RHEL 컴퓨팅 머신 추가
클러스터 관리자는 다음 작업을 수행할 수 있습니다.
2장. Machine API를 사용하여 컴퓨팅 머신 관리
2.1. ECDHE Cloud에서 컴퓨팅 머신 세트 생성
OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.1.1. ECDHE Cloud에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 지정된ECDHE Cloud 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role>-<zone> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <role> 8 machine.openshift.io/cluster-api-machine-type: <role> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> 10 spec: metadata: labels: node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: machine.openshift.io/v1 credentialsSecret: name: alibabacloud-credentials imageId: <image_id> 11 instanceType: <instance_type> 12 kind: AlibabaCloudMachineProviderConfig ramRoleName: <infrastructure_id>-role-worker 13 regionId: <region> 14 resourceGroup: 15 id: <resource_group_id> type: ID securityGroups: - tags: 16 - Key: Name Value: <infrastructure_id>-sg-<role> type: Tags systemDisk: 17 category: cloud_essd size: <disk_size> tag: 18 - Key: kubernetes.io/cluster/<infrastructure_id> Value: owned userDataSecret: name: <user_data_secret> 19 vSwitch: tags: 20 - Key: Name Value: <infrastructure_id>-vswitch-<zone> type: Tags vpcId: "" zoneId: <zone> 21
- 1 5 7
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9
- 추가할 노드 레이블을 지정합니다.
- 4 6 10
- 인프라 ID, 노드 레이블 및 영역을 지정합니다.
- 11
- 사용할 이미지를 지정합니다. 클러스터에 대한 기존 기본 컴퓨팅 시스템 세트의 이미지를 사용합니다.
- 12
- 컴퓨팅 머신 세트에 사용할 인스턴스 유형을 지정합니다.
- 13
- 컴퓨팅 머신 세트에 사용할 RAM 역할의 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.
- 14
- 머신을 배치할 리전을 지정합니다.
- 15
- 클러스터의 리소스 그룹 및 유형을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용하거나 다른 머신을 지정할 수 있습니다.
- 16 18 20
- 컴퓨팅 머신 세트에 사용할 태그를 지정합니다. 최소로 이 예제에 표시된 태그를 클러스터에 적절한 값과 함께 포함해야 합니다. 필요에 따라 설치 프로그램이 생성하는 기본 컴퓨팅 시스템에 채우는 태그를 포함하여 추가 태그를 포함할 수 있습니다.
- 17
- root 디스크의 유형 및 크기를 지정합니다. 설치 프로그램이 생성하는 기본 컴퓨팅 시스템에서 채우는
category
값을 사용합니다. 필요한 경우크기를
위해 다른 값을 기가 바이트로 지정합니다. - 19
openshift-machine-api
네임스페이스에 있는 사용자 데이터 YAML 파일에서 시크릿 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.- 21
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
2.1.1.1. ECDHE Cloud 사용 통계에 대한 머신 세트 매개변수
설치 프로그램이ECDHE Cloud 클러스터에 대해 생성하는 기본 컴퓨팅 머신 세트에는 사용 통계를 추적하는 데 내부적으로 사용하는 필수 태그 값이 포함되어 있습니다. 이러한 태그는 spec.template.spec.providerSpec.value
목록의 securityGroups
,tag
, vSwitch
매개변수로 채워집니다.
추가 시스템을 배포하기 위해 컴퓨팅 머신 세트를 생성할 때 필요한 Kubernetes 태그를 포함해야 합니다. 사용량 통계 태그는 생성한 컴퓨팅 머신 세트에 지정되지 않은 경우에도 기본적으로 적용됩니다. 필요에 따라 추가 태그를 포함할 수도 있습니다.
다음 YAML 스니펫은 기본 컴퓨팅 머신 세트의 태그는 선택 사항이며 필요한 태그를 나타냅니다.
spec.template.spec.providerSpec.value.securityGroups
의 태그
spec: template: spec: providerSpec: value: securityGroups: - tags: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 2 Value: ocp - Key: Name Value: <infrastructure_id>-sg-<role> 3 type: Tags
spec.template.spec.providerSpec.value.tag
의 태그
spec: template: spec: providerSpec: value: tag: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV 2 Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 3 Value: ocp
spec.template.spec.providerSpec.value.vSwitch
의 태그
spec: template: spec: providerSpec: value: vSwitch: tags: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV 2 Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 3 Value: ocp - Key: Name Value: <infrastructure_id>-vswitch-<zone> 4 type: Tags
2.1.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.2. AWS에서 컴퓨팅 머신 세트 생성
AWS(Amazon Web Services)의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.2.1. AWS에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 us-east-1a
AWS(Amazon Web Services) 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 생성합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role>-<zone> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 3 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> 4 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machine-role: <role> 6 machine.openshift.io/cluster-api-machine-type: <role> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> 8 spec: metadata: labels: node-role.kubernetes.io/<role>: "" 9 providerSpec: value: ami: id: ami-046fe691f52a953f9 10 apiVersion: awsproviderconfig.openshift.io/v1beta1 blockDevices: - ebs: iops: 0 volumeSize: 120 volumeType: gp2 credentialsSecret: name: aws-cloud-credentials deviceIndex: 0 iamInstanceProfile: id: <infrastructure_id>-worker-profile 11 instanceType: m6i.large kind: AWSMachineProviderConfig placement: availabilityZone: <zone> 12 region: <region> 13 securityGroups: - filters: - name: tag:Name values: - <infrastructure_id>-worker-sg 14 subnet: filters: - name: tag:Name values: - <infrastructure_id>-private-<zone> 15 tags: - name: kubernetes.io/cluster/<infrastructure_id> 16 value: owned - name: <custom_tag_name> 17 value: <custom_tag_value> 18 userDataSecret: name: worker-user-data
- 1 3 5 11 14 16
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 4 8
- 인프라 ID, 역할 노드 레이블 및 영역을 지정합니다.
- 6 7 9
- 추가할 역할 노드 레이블을 지정합니다.
- 10
- OpenShift Container Platform 노드의 AWS 영역에 유효한 RHCOS(Red Hat Enterprise Linux CoreOS) Amazon 머신 이미지(AMI)를 지정합니다. AWS Marketplace 이미지를 사용하려면 리전의 AMI ID를 얻으려면 AWS Marketplace 에서 OpenShift Container Platform 서브스크립션을 완료해야 합니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.ami.id}{"\n"}' \ get machineset/<infrastructure_id>-<role>-<zone>
- 17 18
- 선택 사항: 클러스터의 사용자 정의 태그 데이터를 지정합니다. 예를 들어 이메일
:admin-email@example.com의
주소를 추가할 수 있습니다.name:value
쌍을 지정하여 관리자 연락처 이메일참고install-config.yml
파일에서 설치 중에 사용자 지정 태그를 지정할 수도 있습니다.install-config.yml
파일과 머신 세트에 동일한이름
데이터가 있는 태그가 포함된 경우 머신 세트의 태그 값이install-config.yml
파일의 태그 값보다 우선합니다. - 12
- 영역을 지정합니다(예:
us-east-1a
). - 13
- 리전을 지정합니다(예:
us-east-1)
. - 15
- 인프라 ID 및 영역을 지정합니다.
2.2.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
- 다른 가용성 영역에 컴퓨팅 머신 세트가 필요한 경우 이 프로세스를 반복하여 더 많은 컴퓨팅 머신 세트를 생성합니다.
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.2.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.2.4. Amazon EC2 인스턴스 메타데이터 서비스에 대한 머신 세트 옵션
머신 세트를 사용하여 특정 버전의 Amazon EC2 Instance Metadata Service(IMDS)를 사용하는 머신을 생성할 수 있습니다. 머신 세트는 IMDSv1 및 IMDSv2 또는 IMDSv2 사용을 필요로 하는 머신 모두를 사용할 수 있는 머신을 생성할 수 있습니다.
IMDSv2 사용은 OpenShift Container Platform 버전 4.7 이상으로 생성된 AWS 클러스터에서만 지원됩니다.
기본 IMDS 구성을 사용하여 새 컴퓨팅 머신을 배포하려면 적절한 값을 사용하여 컴퓨팅 머신 세트 YAML 파일을 생성합니다. 머신 세트가 확장될 때 기존 머신 세트를 편집하여 기본 IMDS 구성으로 새 머신을 생성할 수도 있습니다.
IMDSv2가 필요한 머신을 생성하도록 머신 세트를 구성하기 전에 AWS 메타데이터 서비스와 상호 작용하는 모든 워크로드가 IMDSv2를 지원하는지 확인하십시오.
2.2.4.1. 머신 세트를 사용하여 IMDS 구성
머신 세트 YAML 파일에서 metadataServiceOptions.authentication
값을 추가하거나 편집하여 IMDSv2를 사용할지 여부를 지정할 수 있습니다.
사전 요구 사항
- IMDSv2를 사용하려면 OpenShift Container Platform 버전 4.7 이상을 사용하여 AWS 클러스터가 생성되어 있어야 합니다.
절차
providerSpec
필드 아래에 다음 행을 추가하거나 편집합니다.providerSpec: value: metadataServiceOptions: authentication: Required 1
- 1
- IMDSv2를 요구하려면 매개변수 값을
Required
로 설정합니다. IMDSv1 및 IMDSv2를 모두 사용하려면 매개변수 값을Optional
로 설정합니다. 값이 지정되지 않은 경우 IMDSv1 및 IMDSv2 둘 다 허용됩니다.
2.2.5. 머신을 Dedicated 인스턴스로 배포하는 머신 세트
AWS에서 실행 중인 머신 세트를 생성하여 머신을 Dedicated 인스턴스로 배포할 수 있습니다. Dedicated 인스턴스는 단일 고객 전용 하드웨어의 VPC(가상 프라이빗 클라우드)에서 실행됩니다. 이러한 Amazon EC2 인스턴스는 호스트 하드웨어 수준에서 물리적으로 분리됩니다. Dedicated 인스턴스의 분리는 인스턴스가 하나의 유료 계정에 연결된 다른 AWS 계정에 속하는 경우에도 발생합니다. 하지만 전용이 아닌 다른 인스턴스는 동일한 AWS 계정에 속하는 경우 Dedicated 인스턴스와 하드웨어를 공유할 수 있습니다.
공용 또는 전용 테넌시가 있는 인스턴스는 Machine API에서 지원됩니다. 공용 테넌시가 있는 인스턴스는 공유 하드웨어에서 실행됩니다. 공용 테넌시는 기본 테넌시입니다. 전용 테넌트가 있는 인스턴스는 단일 테넌트 하드웨어에서 실행됩니다.
2.2.5.1. 머신 세트를 사용하여 Dedicated 인스턴스 생성
Machine API 통합을 사용하여 Dedicated 인스턴스에서 지원하는 머신을 실행할 수 있습니다. 머신 세트 YAML 파일의 tenancy
필드를 설정하여 AWS에서 전용 인스턴스를 시작합니다.
절차
providerSpec
필드에서 전용 테넌트를 지정합니다.providerSpec: placement: tenancy: dedicated
2.2.6. 머신을 Spot 인스턴스로 배포하는 머신 세트
AWS에서 실행되는 컴퓨팅 머신 세트를 생성하여 보장되지 않는 Spot 인스턴스로 머신을 배포하면 비용을 절감할 수 있습니다. Spot 인스턴스는 사용되지 않는 AWS EC2 용량을 사용하며 온 디맨드 인스턴스보다 저렴합니다. 일괄 처리 또는 상태 비저장, 수평적으로 확장 가능한 워크로드와 같이 인터럽트를 허용할 수 있는 워크로드에 Spot 인스턴스를 사용할 수 있습니다.
AWS EC2는 언제든지 Spot 인스턴스를 종료할 수 있습니다. AWS는 중단이 발생하면 사용자에게 2 분 동안 경고 메세지를 보냅니다. OpenShift Container Platform은 AWS가 종료에 대한 경고를 발행할 때 영향을 받는 인스턴스에서 워크로드를 제거하기 시작합니다.
다음과 같은 이유로 Spot 인스턴스를 사용할 때 중단될 수 있습니다.
- 인스턴스 가격이 최대 가격을 초과합니다.
- Spot 인스턴스에 대한 수요가 증가합니다.
- Spot 인스턴스의 공급이 감소합니다.
AWS가 인스턴스를 종료하면 Spot 인스턴스 노드에서 실행중인 종료 프로세스가 머신 리소스를 삭제합니다. 컴퓨팅 머신 세트 replicas
수량을 충족하기 위해 컴퓨팅 머신 세트는 Spot 인스턴스를 요청하는 머신을 생성합니다.
2.2.6.1. 컴퓨팅 머신 세트를 사용하여 Spot 인스턴스 생성
컴퓨팅 머신 세트 YAML 파일에 spotMarketOptions
를 추가하여 AWS에서 Spot 인스턴스를 시작할 수 있습니다.
절차
providerSpec
필드 아래에 다음 행을 추가합니다.providerSpec: value: spotMarketOptions: {}
선택 옵션으로
spotMarketOptions.maxPrice
필드를 설정하여 Spot 인스턴스의 비용을 제한할 수 있습니다. 예를 들어maxPrice: '2.50'
을 설정할 수 있습니다.maxPrice
가 설정된 경우 이 값은 시간당 최대 Spot 가격으로 사용됩니다. 이 값이 설정되지 않은 경우 기본적으로 최대 가격은 온 디맨드 인스턴스 가격까지 청구됩니다.참고기본적인 온 디맨드 가격을
maxPrice
값으로 사용하여 Spot 인스턴스의 최대 가격을 설정하지 않는 것이 좋습니다.
2.2.7. 기존 OpenShift Container Platform 클러스터에 GPU 노드 추가
기본 컴퓨팅 머신 세트 구성을 복사하고 수정하여 GPU 지원 머신 세트 및 AWS EC2 클라우드 공급자의 머신을 생성할 수 있습니다.
지원되는 인스턴스 유형에 대한 자세한 내용은 다음 NVIDIA 설명서를 참조하십시오.
절차
다음 명령을 실행하여 기존 노드, 시스템 및 머신 세트를 확인합니다. 각 노드는 특정 AWS 리전 및 OpenShift Container Platform 역할이 있는 머신 정의의 인스턴스입니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION ip-10-0-52-50.us-east-2.compute.internal Ready worker 3d17h v1.26.0 ip-10-0-58-24.us-east-2.compute.internal Ready control-plane,master 3d17h v1.26.0 ip-10-0-68-148.us-east-2.compute.internal Ready worker 3d17h v1.26.0 ip-10-0-68-68.us-east-2.compute.internal Ready control-plane,master 3d17h v1.26.0 ip-10-0-72-170.us-east-2.compute.internal Ready control-plane,master 3d17h v1.26.0 ip-10-0-74-50.us-east-2.compute.internal Ready worker 3d17h v1.26.0
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 머신 및 머신 세트를 확인합니다. 각 컴퓨팅 머신 세트는 AWS 리전 내의 다른 가용성 영역과 연결되어 있습니다. 설치 프로그램은 가용 영역 전체에 컴퓨팅 시스템을 자동으로 로드합니다.$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE preserve-dsoc12r4-ktjfc-worker-us-east-2a 1 1 1 1 3d11h preserve-dsoc12r4-ktjfc-worker-us-east-2b 2 2 2 2 3d11h
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 시스템을 확인합니다. 현재 머신 세트당 하나의 컴퓨팅 머신만 있지만 특정 리전 및 영역에서 노드를 추가하도록 컴퓨팅 머신 세트를 확장할 수 있었습니다.$ oc get machines -n openshift-machine-api | grep worker
출력 예
preserve-dsoc12r4-ktjfc-worker-us-east-2a-dts8r Running m5.xlarge us-east-2 us-east-2a 3d11h preserve-dsoc12r4-ktjfc-worker-us-east-2b-dkv7w Running m5.xlarge us-east-2 us-east-2b 3d11h preserve-dsoc12r4-ktjfc-worker-us-east-2b-k58cw Running m5.xlarge us-east-2 us-east-2b 3d11h
다음 명령을 실행하여 기존 컴퓨팅
MachineSet
정의 중 하나의 사본을 만들고 결과를 JSON 파일로 출력합니다. GPU 지원 컴퓨팅 머신 세트 정의의 기반이 됩니다.$ oc get machineset preserve-dsoc12r4-ktjfc-worker-us-east-2a -n openshift-machine-api -o json > <output_file.json>
JSON 파일을 편집하고 새
MachineSet
정의를 다음과 같이 변경합니다.-
worker
를gpu
로 바꿉니다. 이는 새 머신 세트의 이름이 됩니다. 새
MachineSet
정의의 인스턴스 유형을 NVIDIA T4 GPU를 포함하는g4dn
으로 변경합니다. AWSg4dn
인스턴스 유형에 대한 자세한 내용은 가속 컴퓨팅 을 참조하십시오.$ jq .spec.template.spec.providerSpec.value.instanceType preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a.json "g4dn.xlarge"
<
output_file.json
> 파일은preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a.json
으로 저장됩니다.
-
preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a.json
에서 다음 필드를 업데이트합니다.-
gpu
를 포함하는이름의 .metadata
.name. -
새로운
.metadata.name
과 일치하도록.spec.selector.matchLabels["machine.openshift.io/cluster-api-machineset"]
. -
새로운
.metadata.name
과 일치하는.spec.template.metadata.labels["machine.openshift.io/cluster-api-machineset"]
입니다. -
.spec.template.spec.providerSpec.value.instanceType
에서g4dn.xlarge
.
-
변경 사항을 확인하려면 다음 명령을 실행하여 원래 컴퓨팅 정의와 새 GPU 지원 노드 정의를 수행합니다.
$ oc -n openshift-machine-api get preserve-dsoc12r4-ktjfc-worker-us-east-2a -o json | diff preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a.json -
출력 예
10c10 < "name": "preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a", --- > "name": "preserve-dsoc12r4-ktjfc-worker-us-east-2a", 21c21 < "machine.openshift.io/cluster-api-machineset": "preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a" --- > "machine.openshift.io/cluster-api-machineset": "preserve-dsoc12r4-ktjfc-worker-us-east-2a" 31c31 < "machine.openshift.io/cluster-api-machineset": "preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a" --- > "machine.openshift.io/cluster-api-machineset": "preserve-dsoc12r4-ktjfc-worker-us-east-2a" 60c60 < "instanceType": "g4dn.xlarge", --- > "instanceType": "m5.xlarge",
다음 명령을 실행하여 정의에서 GPU 지원 컴퓨팅 머신 세트를 생성합니다.
$ oc create -f preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a.json
출력 예
machineset.machine.openshift.io/preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a created
검증
다음 명령을 실행하여 생성한 머신 세트를 확인합니다.
$ oc -n openshift-machine-api get machinesets | grep gpu
MachineSet 복제본 수가
1
로 설정되어 새Machine
오브젝트가 자동으로 생성됩니다.출력 예
preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a 1 1 1 1 4m21s
다음 명령을 실행하여 머신 세트에서 생성된
Machine
오브젝트를 표시합니다.$ oc -n openshift-machine-api get machines | grep gpu
출력 예
preserve-dsoc12r4-ktjfc-worker-gpu-us-east-2a running g4dn.xlarge us-east-2 us-east-2a 4m36s
노드의 네임스페이스를 지정할 필요가 없습니다. 노드 정의는 클러스터 범위가 지정되었습니다.
2.2.8. Node Feature Discovery Operator 배포
GPU 지원 노드가 생성되면 예약할 수 있도록 GPU 지원 노드를 검색해야 합니다. 이렇게 하려면 NFD(Node Feature Discovery) Operator를 설치합니다. NFD Operator는 노드의 하드웨어 장치 기능을 식별합니다. OpenShift Container Platform에서 사용할 수 있도록 인프라 노드에서 하드웨어 리소스를 식별하고 카탈로그하는 일반적인 문제를 해결합니다.
절차
- OpenShift Container Platform 콘솔의 OperatorHub 에서 Node Feature Discovery Operator를 설치합니다.
-
OperatorHub 에 NFD Operator를 설치한 후 설치된 Operator 목록에서 Node Feature Discovery 를 선택하고 인스턴스 생성 을 선택합니다. 이렇게 하면
openshift-nfd
네임스페이스에 각 컴퓨팅 노드에 대해nfd-master
및nfd-worker
다음 명령을 실행하여 Operator가 설치되어 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 1d
- 콘솔에서 설치된 Oerator로 이동하여 Create Node Feature Discovery 를 선택합니다.
-
생성 을 선택하여 NFD 사용자 정의 리소스를 빌드합니다. 이렇게 하면
openshift-nfd
네임스페이스에 NFD Pod가 생성되어 OpenShift Container Platform 노드에서 하드웨어 리소스에 대해 폴링하고 카탈로그를 작성합니다.
검증
성공적으로 빌드한 후 다음 명령을 실행하여 NFD Pod가 각 노드에서 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 12d nfd-master-769656c4cb-w9vrv 1/1 Running 0 12d nfd-worker-qjxb2 1/1 Running 3 (3d14h ago) 12d nfd-worker-xtz9b 1/1 Running 5 (3d14h ago) 12d
NFD Operator는 공급 업체 PCI ID를 사용하여 노드에서 하드웨어를 식별합니다. NVIDIA는 PCI ID
10de
를 사용합니다.다음 명령을 실행하여 NFD Operator에서 검색한 NVIDIA GPU를 확인합니다.
$ oc describe node ip-10-0-132-138.us-east-2.compute.internal | egrep 'Roles|pci'
출력 예
Roles: worker feature.node.kubernetes.io/pci-1013.present=true feature.node.kubernetes.io/pci-10de.present=true feature.node.kubernetes.io/pci-1d0f.present=true
10de
는 GPU 지원 노드의 노드 기능 목록에 표시됩니다. 즉, NFD Operator가 GPU 지원 MachineSet에서 노드를 올바르게 식별했습니다.
2.3. Azure에서 컴퓨팅 머신 세트 생성
Microsoft Azure의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.3.1. Azure에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 1
Microsoft Azure 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> name: <infrastructure_id>-<role>-<region> 3 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> spec: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-machineset: <machineset_name> node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: azureproviderconfig.openshift.io/v1beta1 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api image: 4 offer: "" publisher: "" resourceID: /resourceGroups/<infrastructure_id>-rg/providers/Microsoft.Compute/galleries/gallery_<infrastructure_id>/images/<infrastructure_id>-gen2/versions/latest 5 sku: "" version: "" internalLoadBalancer: "" kind: AzureMachineProviderSpec location: <region> 6 managedIdentity: <infrastructure_id>-identity metadata: creationTimestamp: null natRule: null networkResourceGroup: "" osDisk: diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: "" resourceGroup: <infrastructure_id>-rg sshPrivateKey: "" sshPublicKey: "" tags: - name: <custom_tag_name> 7 value: <custom_tag_value> subnet: <infrastructure_id>-<role>-subnet userDataSecret: name: worker-user-data vmSize: Standard_D4s_v3 vnet: <infrastructure_id>-vnet zone: "1" 8
- 1
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
다음 명령을 실행하여 서브넷을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.subnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
다음 명령을 실행하여 vnet을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.vnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
- 2
- 추가할 노드 레이블을 지정합니다.
- 3
- 인프라 ID, 노드 레이블, 리전을 지정합니다.
- 4
- 컴퓨팅 머신 세트의 이미지 세부 정보를 지정합니다. Azure Marketplace 이미지를 사용하려면 "Azure Marketplace 이미지 선택"을 참조하십시오.
- 5
- 인스턴스 유형과 호환되는 이미지를 지정합니다. 설치 프로그램에 의해 생성된 Hyper-V 생성 V2 이미지에는
-gen2
접미사가 있으며 V1 이미지는 접미사 없이 이름이 동일합니다. - 6
- 머신을 배치할 리전을 지정합니다.
- 7
- 선택 사항: 머신 세트에서 사용자 지정 태그를 지정합니다. 태그 이름을 <
custom_tag_name
> 필드에 제공하고 해당 태그 값을 <custom_tag_value
> 필드에 입력합니다. - 8
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전에서 지정하는 영역을 지원하는지 확인합니다.중요
리전에서 가용성 영역을 지원하는 경우 영역을 지정해야 합니다. 영역을 지정하면 Pod에 영구 볼륨 연결이 필요한 경우 볼륨 노드 유사성 오류가 발생하지 않습니다. 이를 위해 동일한 리전의 각 영역에 대한 컴퓨팅 머신 세트를 생성할 수 있습니다.
2.3.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.3.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.3.4. Azure Marketplace 이미지 선택
Azure에서 실행되는 머신 세트를 생성하여 Azure Marketplace 오퍼링을 사용하는 머신을 배포할 수 있습니다. 이 서비스를 사용하려면 먼저 Azure Marketplace 이미지를 가져와야 합니다. 이미지를 가져올 때 다음 사항을 고려하십시오.
-
이미지는 동일하지만 Azure Marketplace 게시자는 해당 지역에 따라 다릅니다. 북미에 있는 경우 게시자로
redhat
을 지정합니다. EMEA에 있는 경우 게시자로redhat-limited
를 지정합니다. -
이 제안에는
rh-ocp-worker
SKU 및rh-ocp-worker-gen1
SKU가 포함되어 있습니다.rh-ocp-worker
SKU는 Hyper-V 생성 버전 2 VM 이미지를 나타냅니다. OpenShift Container Platform에 사용되는 기본 인스턴스 유형은 버전 2와 호환됩니다. 버전 1과 호환되는 인스턴스 유형을 사용하려는 경우rh-ocp-worker-gen1
SKU와 연결된 이미지를 사용합니다.rh-ocp-worker-gen1
SKU는 Hyper-V 버전 1 VM 이미지를 나타냅니다.
Azure Marketplace를 사용하여 이미지를 설치하는 것은 64비트 ARM 인스턴스가 있는 클러스터에서는 지원되지 않습니다.
사전 요구 사항
-
Azure CLI 클라이언트
(az)
를 설치했습니다. - Azure 계정은 해당 오퍼를 사용할 수 있으며 Azure CLI 클라이언트를 사용하여 이 계정에 로그인했습니다.
절차
다음 명령 중 하나를 실행하여 사용 가능한 OpenShift Container Platform 이미지를 모두 표시합니다.
북아메리카:
$ az vm image list --all --offer rh-ocp-worker --publisher redhat -o table
출력 예
Offer Publisher Sku Urn Version ------------- -------------- ------------------ -------------------------------------------------------------- -------------- rh-ocp-worker RedHat rh-ocp-worker RedHat:rh-ocp-worker:rh-ocpworker:4.8.2021122100 4.8.2021122100 rh-ocp-worker RedHat rh-ocp-worker-gen1 RedHat:rh-ocp-worker:rh-ocp-worker-gen1:4.8.2021122100 4.8.2021122100
EMEA:
$ az vm image list --all --offer rh-ocp-worker --publisher redhat-limited -o table
출력 예
Offer Publisher Sku Urn Version ------------- -------------- ------------------ -------------------------------------------------------------- -------------- rh-ocp-worker redhat-limited rh-ocp-worker redhat-limited:rh-ocp-worker:rh-ocp-worker:4.8.2021122100 4.8.2021122100 rh-ocp-worker redhat-limited rh-ocp-worker-gen1 redhat-limited:rh-ocp-worker:rh-ocp-worker-gen1:4.8.2021122100 4.8.2021122100
참고설치하는 OpenShift Container Platform 버전에 관계없이 사용할 Azure Marketplace 이미지의 올바른 버전은 4.8입니다. 필요한 경우 설치 프로세스의 일부로 VM이 자동으로 업그레이드됩니다.
다음 명령 중 하나를 실행하여 제공 이미지를 검사합니다.
북아메리카:
$ az vm image show --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image show --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
다음 명령 중 하나를 실행하여 제안 조건을 검토합니다.
북아메리카:
$ az vm image terms show --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image terms show --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
다음 명령 중 하나를 실행하여 제공 조건을 수락합니다.
북아메리카:
$ az vm image terms accept --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image terms accept --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
-
제공 사항의 이미지 세부 정보, 특히
게시자
,제공
값, 스쿠및
버전
. 제공 이미지 세부 정보를 사용하여 머신 세트 YAML 파일의
providerSpec
섹션에 다음 매개변수를 추가합니다.Azure Marketplace 머신의
providerSpec
이미지 값 샘플providerSpec: value: image: offer: rh-ocp-worker publisher: redhat resourceID: "" sku: rh-ocp-worker type: MarketplaceWithPlan version: 4.8.2021122100
2.3.5. Azure 부팅 진단 활성화
머신 세트가 생성하는 Azure 머신에서 부팅 진단을 활성화할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure 클러스터가 있어야 합니다.
절차
머신 세트 YAML 파일의
providerSpec
필드에 스토리지 유형에 적용할 수 있는진단
구성을 추가합니다.Azure Managed 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: AzureManaged 1
- 1
- Azure Managed 스토리지 계정을 지정합니다.
Azure Unmanaged 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: CustomerManaged 1 customerManaged: storageAccountURI: https://<storage-account>.blob.core.windows.net 2
참고Azure Blob Storage 데이터 서비스만 지원됩니다.
검증
- Microsoft Azure 포털에서 머신 세트에서 배포한 머신의 부팅 진단 페이지를 검토하고 머신의 직렬 로그를 확인할 수 있는지 확인합니다.
2.3.6. 머신을 Spot 가상머신으로 배포하는 머신 세트
Azure에서 실행되는 컴퓨팅 머신 세트를 생성하여 머신을 보장되지 않는 Spot 가상 머신으로 배포하면 비용을 절감할 수 있습니다. Spot 가상 머신은 사용되지 않은 Azure 용량을 사용하며 표준 가상 머신보다 비용이 저렴합니다. 일괄 처리 또는 상태 비저장, 수평적으로 확장 가능한 워크로드와 같이 인터럽트를 허용할 수 있는 워크로드에 Spot 가상 머신을 사용할 수 있습니다.
Azure는 언제든지 Spot 가상 머신을 종료 할 수 있습니다. Azure는 중단이 발생하면 사용자에게 30 초 동안 경고 메세지를 보냅니다. OpenShift Container Platform은 Azure가 종료 경고를 발행할 때 영향을 받는 인스턴스에서 워크로드를 제거하기 시작합니다.
다음과 같은 이유로 Spot 가상 머신을 사용할 때 중단될 수 있습니다.
- 인스턴스 가격이 최대 가격을 초과합니다.
- Spot 가상 머신의 공급이 감소합니다.
- Azure는 용량을 복원해야합니다.
Azure가 인스턴스를 종료하면 Spot 가상 머신 노드에서 실행되는 종료 프로세스가 머신 리소스를 삭제합니다. 컴퓨팅 머신 세트 replicas
수량을 충족하기 위해 컴퓨팅 머신 세트는 Spot 가상 머신을 요청하는 머신을 생성합니다.
2.3.6.1. 컴퓨팅 머신 세트를 사용하여 Spot 가상 머신 생성
컴퓨팅 머신 세트 YAML 파일에 spotVMOptions
를 추가하여 Azure에서 Spot 가상 머신을 시작할 수 있습니다.
절차
providerSpec
필드 아래에 다음 행을 추가합니다.providerSpec: value: spotVMOptions: {}
필요한 경우
spotVMOptions.maxPrice
필드를 설정하여 Spot 가상 머신의 비용을 제한할 수 있습니다. 예를 들어maxPrice: '0.98765'
를 설정할 수 있습니다.maxPrice
가 설정된 경우 이 값은 시간당 최대 Spot 가격으로 사용됩니다. 설정되지 않은 경우 최대 가격은 기본적으로-1
로 설정된 표준 가상 머신 가격까지 청구됩니다.Azure는 Spot 가상 머신 가격을 표준 가격으로 제한합니다. 인스턴스가 기본
maxPrice
로 설정된 경우 Azure는 가격 설정에 따라 인스턴스를 제거하지 않습니다. 그러나 용량 제한으로 인해 인스턴스를 제거할 수 있습니다.
기본 표준 가상 머신 가격을 maxPrice
값으로 사용하고 Spot 가상 머신의 최대 가격을 설정하지 않는 것이 좋습니다.
2.3.7. 임시 OS 디스크에 머신을 배포하는 머신 세트
Azure에서 실행되는 컴퓨팅 머신 세트를 생성하여 임시 OS 디스크에 머신을 배포할 수 있습니다. 임시 OS 디스크는 원격 Azure Storage가 아닌 로컬 VM 용량을 사용합니다. 따라서 이 구성에서는 추가 비용이 발생하지 않으며 읽기, 쓰기 및 재방화에 대한 대기 시간이 단축됩니다.
추가 리소스
- 자세한 내용은 Azure VM용 임시 OS 디스크에 대한 Microsoft Azure 설명서를 참조하십시오.
2.3.7.1. 컴퓨팅 머신 세트를 사용하여 임시 OS 디스크에서 머신 생성
컴퓨팅 머신 세트 YAML 파일을 편집하여 Azure의 임시 OS 디스크에서 머신을 시작할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure 클러스터가 있어야 합니다.
절차
다음 명령을 실행하여 CR(사용자 정의 리소스)을 편집합니다.
$ oc edit machineset <machine-set-name>
여기서
<machine-set-name
>은 임시 OS 디스크에 머신을 프로비저닝할 컴퓨팅 머신 세트입니다.providerSpec
필드에 다음을 추가합니다.providerSpec: value: ... osDisk: ... diskSettings: 1 ephemeralStorageLocation: Local 2 cachingType: ReadOnly 3 managedDisk: storageAccountType: Standard_LRS 4 ...
중요OpenShift Container Platform에서 임시 OS 디스크 지원 구현은
CacheDisk
배치 유형만 지원합니다.배치
구성 설정은 변경하지 마십시오.업데이트된 구성을 사용하여 컴퓨팅 머신 세트를 생성합니다.
$ oc create -f <machine-set-config>.yaml
검증
-
Microsoft Azure 포털에서 컴퓨팅 머신 세트에서 배포한 머신의 개요 페이지를 검토하고
임시 OS 디스크 필드가
로 설정되어 있는지 확인합니다.OS
캐시 배치
2.3.8. 울트라 디스크가 있는 머신을 데이터 디스크로 배포하는 머신 세트
Azure에서 실행되는 머신 세트를 생성하여 경미한 디스크가 있는 머신을 배포할 수 있습니다. Ultra 디스크는 가장 엄격한 데이터 워크로드와 함께 사용하도록 설계된 고성능 스토리지입니다.
Azure AMQ 디스크가 지원하는 스토리지 클래스에 동적으로 바인딩하고 이를 Pod에 마운트하는 PVC(영구 볼륨 클레임)를 생성할 수도 있습니다.
데이터 디스크는 디스크 처리량 또는 디스크 IOPS를 지정하는 기능을 지원하지 않습니다. PVC를 사용하여 이러한 속성을 구성할 수 있습니다.
추가 리소스
2.3.8.1. 머신 세트를 사용하여 무기 디스크로 머신 생성
머신 세트 YAML 파일을 편집하여 Azure에 simple 디스크가 있는 머신을 배포할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure 클러스터가 있어야 합니다.
절차
다음 명령을 실행하여
worker
데이터 시크릿을 사용하여openshift-machine-api
네임스페이스에 사용자 정의 보안을 생성합니다.$ oc -n openshift-machine-api \ get secret <role>-user-data \ 1 --template='{{index .data.userData | base64decode}}' | jq > userData.txt 2
텍스트 편집기에서
userData.txt
파일을 열고 파일에서 최종}
문자를 찾습니다.-
바로 위의 줄에서
,
을 추가합니다. 뒤에 새 행을 생성하고 다음 구성 세부 정보를 추가합니다.
"storage": { "disks": [ 1 { "device": "/dev/disk/azure/scsi1/lun0", 2 "partitions": [ 3 { "label": "lun0p1", 4 "sizeMiB": 1024, 5 "startMiB": 0 } ] } ], "filesystems": [ 6 { "device": "/dev/disk/by-partlabel/lun0p1", "format": "xfs", "path": "/var/lib/lun0p1" } ] }, "systemd": { "units": [ 7 { "contents": "[Unit]\nBefore=local-fs.target\n[Mount]\nWhere=/var/lib/lun0p1\nWhat=/dev/disk/by-partlabel/lun0p1\nOptions=defaults,pquota\n[Install]\nWantedBy=local-fs.target\n", 8 "enabled": true, "name": "var-lib-lun0p1.mount" } ] }
- 1
- 노드에 연결할 디스크에 대한 구성 세부 정보입니다.
- 2
- 사용 중인 머신 세트의
dataDisks
스탠자에 정의된lun
값을 지정합니다. 예를 들어 시스템 세트에lun: 0
이 포함된 경우lun0
을 지정합니다. 이 구성 파일에서 여러 "디스크"
항목을 지정하여 여러 데이터 디스크를 초기화할 수 있습니다. 여러 개의"디스크"
항목을 지정하는 경우 시스템 세트의 각 파일에 대한lun
값이 일치하는지 확인합니다. - 3
- 디스크의 새 파티션에 대한 구성 세부 정보입니다.
- 4
- 파티션의 레이블을 지정합니다.
lun0
의 첫 번째 파티션에lun0p1
과 같은 계층적 이름을 사용하는 것이 유용할 수 있습니다. - 5
- 파티션의 총 크기를 MiB로 지정합니다.
- 6
- 파티션을 포맷할 때 사용할 파일 시스템을 지정합니다. 파티션 레이블을 사용하여 파티션을 지정합니다.
- 7
- 부팅 시 파티션을 마운트할
systemd
장치를 지정합니다. 파티션 레이블을 사용하여 파티션을 지정합니다. 이 구성 파일에 여러 개의"파티션"
항목을 지정하여 여러 파티션을 생성할 수 있습니다. 여러 개의"파티션"
항목을 지정하는 경우 각각에 대해systemd
장치를 지정해야 합니다. - 8
Where
.filesystems.path
의 값을 지정합니다.What
?에 대해storage.filesystems.device
의 값을 지정합니다.
-
바로 위의 줄에서
다음 명령을 실행하여
disableTemplating.txt
라는 파일에 disabling template 값을 추출합니다.$ oc -n openshift-machine-api get secret <role>-user-data \ 1 --template='{{index .data.disableTemplating | base64decode}}' | jq > disableTemplating.txt
- 1
- <
;role>
을worker
로 바꿉니다.
userData.txt
파일을 결합하고Templating.txt 파일을 비활성화
하여 다음 명령을 실행하여 데이터 시크릿 파일을 생성합니다.$ oc -n openshift-machine-api create secret generic <role>-user-data-x5 \ 1 --from-file=userData=userData.txt \ --from-file=disableTemplating=disableTemplating.txt
- 1
- &
lt;role>-user-data-x5
의 경우 시크릿 이름을 지정합니다. <role>
을worker
로 바꿉니다.
기존 Azure
MachineSet
CR(사용자 정의 리소스)을 복사하고 다음 명령을 실행하여 편집합니다.$ oc edit machineset <machine-set-name>
여기서
<machine-set-name
>은 디스크가 있는 머신을 프로비저닝할 머신 세트입니다.표시된 위치에 다음 행을 추가합니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet spec: template: spec: metadata: labels: disk: ultrassd 1 providerSpec: value: ultraSSDCapability: Enabled 2 dataDisks: 3 - nameSuffix: ultrassd lun: 0 diskSizeGB: 4 deletionPolicy: Delete cachingType: None managedDisk: storageAccountType: UltraSSD_LRS userDataSecret: name: <role>-user-data-x5 4
다음 명령을 실행하여 업데이트된 구성을 사용하여 머신 세트를 생성합니다.
$ oc create -f <machine-set-name>.yaml
검증
다음 명령을 실행하여 시스템이 생성되었는지 확인합니다.
$ oc get machines
시스템이
Running
상태에 있어야 합니다.실행 중이고 노드가 연결된 머신의 경우 다음 명령을 실행하여 파티션을 검증합니다.
$ oc debug node/<node-name> -- chroot /host lsblk
이 명령에서
oc debug node/<node-name
>은 <node-name
> 노드에서 디버깅 쉘을 시작하고--
를 사용하여 명령을 전달합니다. 전달된 명령chroot /host
는 기본 호스트 OS 바이너리에 대한 액세스를 제공하며lsblk
는 호스트 OS 시스템에 연결된 블록 장치를 보여줍니다.
다음 단계
Pod에서 경미한 디스크를 사용하려면 마운트 지점을 사용하는 워크로드를 생성합니다. 다음 예와 유사한 YAML 파일을 생성합니다.
apiVersion: v1 kind: Pod metadata: name: ssd-benchmark1 spec: containers: - name: ssd-benchmark1 image: nginx ports: - containerPort: 80 name: "http-server" volumeMounts: - name: lun0p1 mountPath: "/tmp" volumes: - name: lun0p1 hostPath: path: /var/lib/lun0p1 type: DirectoryOrCreate nodeSelector: disktype: ultrassd
2.3.8.2. 경미한 디스크를 활성화하는 머신 세트의 리소스 문제 해결
이 섹션의 정보를 사용하여 발생할 수 있는 문제를 이해하고 복구합니다.
2.3.8.2.1. 잘못된 디스크 구성
시스템 세트에 FCP Capability
매개변수의 잘못된 구성이 지정되면 머신 프로비저닝이 실패합니다.
예를 들어, Restic SSDCapability
매개변수가 Disabled
로 설정되어 있지만 dataDisks
매개변수에 영구 디스크가 지정된 경우 다음과 같은 오류 메시지가 표시됩니다.
StorageAccountType UltraSSD_LRS can be used only when additionalCapabilities.ultraSSDEnabled is set.
- 이 문제를 해결하려면 머신 세트 구성이 올바른지 확인합니다.
2.3.8.2.2. 지원되지 않는 디스크 매개변수
자명 디스크와 호환되지 않는 리전, 가용성 영역 또는 인스턴스 크기가 머신 세트에 지정되면 머신 프로비저닝이 실패합니다. 다음 오류 메시지에 대한 로그를 확인합니다.
failed to create vm <machine_name>: failure sending request for machine <machine_name>: cannot create vm: compute.VirtualMachinesClient#CreateOrUpdate: Failure sending request: StatusCode=400 -- Original Error: Code="BadRequest" Message="Storage Account type 'UltraSSD_LRS' is not supported <more_information_about_why>."
- 이 문제를 해결하려면 지원되는 환경에서 이 기능을 사용하고 있고 머신 세트 구성이 올바른지 확인합니다.
2.3.8.2.3. 디스크를 삭제할 수 없음
데이터 디스크가 예상대로 작동하지 않기 때문에 경미한 디스크를 삭제하면 머신이 삭제되고 데이터 디스크가 분리됩니다. 필요한 경우 고립된 디스크를 수동으로 삭제해야 합니다.
2.3.9. 머신 세트의 고객 관리 암호화 키 활성화
Azure에 암호화 키를 제공하여 관리 대상 디스크의 데이터를 암호화할 수 있습니다. 시스템 API를 사용하여 고객 관리 키로 서버 측 암호화를 활성화할 수 있습니다.
고객 관리 키를 사용하려면 Azure Key Vault, 디스크 암호화 세트 및 암호화 키가 필요합니다. 디스크 암호화 세트는 CCO(Cloud Credential Operator)에서 권한을 부여한 리소스 그룹에 있어야 합니다. 그렇지 않은 경우 디스크 암호화 세트에 추가 reader 역할을 부여해야 합니다.
절차
머신 세트 YAML 파일의
providerSpec
필드에 설정된 디스크 암호화를 구성합니다. 예를 들면 다음과 같습니다.providerSpec: value: osDisk: diskSizeGB: 128 managedDisk: diskEncryptionSet: id: /subscriptions/<subscription_id>/resourceGroups/<resource_group_name>/providers/Microsoft.Compute/diskEncryptionSets/<disk_encryption_set_name> storageAccountType: Premium_LRS
추가 리소스
2.3.10. Microsoft Azure VM용 네트워킹 가속화
빠른 네트워킹은 단일 루트 I/O 가상화(SR-IOV)를 사용하여 Microsoft Azure VM에 스위치에 더 직접적인 경로를 제공합니다. 이를 통해 네트워크 성능이 향상됩니다. 이 기능은 설치 중 또는 설치 후 활성화할 수 있습니다.
2.3.10.1. 제한
Accelerated Networking을 사용할지 여부를 결정할 때 다음과 같은 제한 사항을 고려하십시오.
- 빠른 네트워킹은 머신 API가 작동하는 클러스터에서만 지원됩니다.
Azure 작업자 노드에 대한 최소 요구 사항은 두 개의 vCPU이지만 가속 네트워킹에는 최소 4개의 vCPU가 포함된 Azure VM 크기가 필요합니다. 이 요구 사항을 충족하기 위해 머신 세트의
vmSize
값을 변경할 수 있습니다. Azure VM 크기에 대한 자세한 내용은 Microsoft Azure 설명서를 참조하십시오.
- 기존 Azure 클러스터에서 이 기능을 활성화하면 새로 프로비저닝된 노드만 영향을 받습니다. 현재 실행 중인 노드는 조정되지 않습니다. 모든 노드에서 이 기능을 활성화하려면 기존 머신을 각각 교체해야 합니다. 이 작업은 각 시스템에 대해 개별적으로 수행하거나 복제본을 0으로 축소한 다음 원하는 복제본 수로 백업하여 수행할 수 있습니다.
2.3.11. 기존 OpenShift Container Platform 클러스터에 GPU 노드 추가
기본 컴퓨팅 머신 세트 구성을 복사하고 수정하여 Azure 클라우드 공급자의 GPU 지원 머신 세트 및 머신을 만들 수 있습니다.
다음 표에는 검증된 인스턴스 유형이 나열되어 있습니다.
vmSize | NVIDIA GPU 가속기 | 최대 GPU 수 | 아키텍처 |
---|---|---|---|
| V100 | 4 | x86 |
| T4 | 1 | x86 |
| A100 | 8 | x86 |
기본적으로 Azure 서브스크립션에는 GPU를 사용하는 Azure 인스턴스 유형에 대한 할당량이 없습니다. 고객은 위에 나열된 Azure 인스턴스 제품군에 대한 할당량 증가를 요청해야 합니다.
절차
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 머신 및 머신 세트를 확인합니다. 각 컴퓨팅 머신 세트는 Azure 리전 내의 다른 가용성 영역과 연결되어 있습니다. 설치 프로그램은 가용 영역 전체에 컴퓨팅 시스템을 자동으로 로드합니다.$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE myclustername-worker-centralus1 1 1 1 1 6h9m myclustername-worker-centralus2 1 1 1 1 6h9m myclustername-worker-centralus3 1 1 1 1 6h9m
기존 컴퓨팅
MachineSet
정의 중 하나의 사본을 만들고 다음 명령을 실행하여 결과를 YAML 파일에 출력합니다. GPU 지원 컴퓨팅 머신 세트 정의의 기반이 됩니다.$ oc get machineset -n openshift-machine-api myclustername-worker-centralus1 -o yaml > machineset-azure.yaml
머신 세트 내용을 표시합니다.
$ cat machineset-azure.yaml
machineset-azure.yaml
파일 예apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: annotations: machine.openshift.io/GPU: "0" machine.openshift.io/memoryMb: "16384" machine.openshift.io/vCPU: "4" creationTimestamp: "2023-02-06T14:08:19Z" generation: 1 labels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machine-role: worker machine.openshift.io/cluster-api-machine-type: worker name: myclustername-worker-centralus1 namespace: openshift-machine-api resourceVersion: "23601" uid: acd56e0c-7612-473a-ae37-8704f34b80de spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machineset: myclustername-worker-centralus1 template: metadata: labels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machine-role: worker machine.openshift.io/cluster-api-machine-type: worker machine.openshift.io/cluster-api-machineset: myclustername-worker-centralus1 spec: lifecycleHooks: {} metadata: {} providerSpec: value: acceleratedNetworking: true apiVersion: machine.openshift.io/v1beta1 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api diagnostics: {} image: offer: "" publisher: "" resourceID: /resourceGroups/myclustername-rg/providers/Microsoft.Compute/galleries/gallery_myclustername_n6n4r/images/myclustername-gen2/versions/latest sku: "" version: "" kind: AzureMachineProviderSpec location: centralus managedIdentity: myclustername-identity metadata: creationTimestamp: null networkResourceGroup: myclustername-rg osDisk: diskSettings: {} diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: myclustername resourceGroup: myclustername-rg spotVMOptions: {} subnet: myclustername-worker-subnet userDataSecret: name: worker-user-data vmSize: Standard_D4s_v3 vnet: myclustername-vnet zone: "1" status: availableReplicas: 1 fullyLabeledReplicas: 1 observedGeneration: 1 readyReplicas: 1 replicas: 1
다음 명령을 실행하여
machineset-azure.yaml
파일의 사본을 만듭니다.$ cp machineset-azure.yaml machineset-azure-gpu.yaml
machineset-azure-gpu.yaml
에서 다음 필드를 업데이트합니다.-
.metadata.name
을gpu
가 포함된 이름으로 변경합니다. -
새 .metadata.name과 일치하도록
.spec.selector.matchLabels["machine.openshift.io/cluster-api-machineset"]
를 변경합니다. -
새
.metadata.name
과 일치하도록.spec.template.metadata.labels["machine.openshift.io/cluster-api-machineset"]
를 변경합니다. .spec.template.spec.providerSpec.value.vmSize
를Standard_NC4as_T4_v3
로 변경합니다.machineset-azure-gpu.yaml
파일 예apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: annotations: machine.openshift.io/GPU: "1" machine.openshift.io/memoryMb: "28672" machine.openshift.io/vCPU: "4" creationTimestamp: "2023-02-06T20:27:12Z" generation: 1 labels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machine-role: worker machine.openshift.io/cluster-api-machine-type: worker name: myclustername-nc4ast4-gpu-worker-centralus1 namespace: openshift-machine-api resourceVersion: "166285" uid: 4eedce7f-6a57-4abe-b529-031140f02ffa spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machineset: myclustername-nc4ast4-gpu-worker-centralus1 template: metadata: labels: machine.openshift.io/cluster-api-cluster: myclustername machine.openshift.io/cluster-api-machine-role: worker machine.openshift.io/cluster-api-machine-type: worker machine.openshift.io/cluster-api-machineset: myclustername-nc4ast4-gpu-worker-centralus1 spec: lifecycleHooks: {} metadata: {} providerSpec: value: acceleratedNetworking: true apiVersion: machine.openshift.io/v1beta1 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api diagnostics: {} image: offer: "" publisher: "" resourceID: /resourceGroups/myclustername-rg/providers/Microsoft.Compute/galleries/gallery_myclustername_n6n4r/images/myclustername-gen2/versions/latest sku: "" version: "" kind: AzureMachineProviderSpec location: centralus managedIdentity: myclustername-identity metadata: creationTimestamp: null networkResourceGroup: myclustername-rg osDisk: diskSettings: {} diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: myclustername resourceGroup: myclustername-rg spotVMOptions: {} subnet: myclustername-worker-subnet userDataSecret: name: worker-user-data vmSize: Standard_NC4as_T4_v3 vnet: myclustername-vnet zone: "1" status: availableReplicas: 1 fullyLabeledReplicas: 1 observedGeneration: 1 readyReplicas: 1 replicas: 1
-
변경 사항을 확인하려면 다음 명령을 실행하여 원래 컴퓨팅 정의와 새 GPU 지원 노드 정의를 수행합니다.
$ diff machineset-azure.yaml machineset-azure-gpu.yaml
출력 예
14c14 < name: myclustername-worker-centralus1 --- > name: myclustername-nc4ast4-gpu-worker-centralus1 23c23 < machine.openshift.io/cluster-api-machineset: myclustername-worker-centralus1 --- > machine.openshift.io/cluster-api-machineset: myclustername-nc4ast4-gpu-worker-centralus1 30c30 < machine.openshift.io/cluster-api-machineset: myclustername-worker-centralus1 --- > machine.openshift.io/cluster-api-machineset: myclustername-nc4ast4-gpu-worker-centralus1 67c67 < vmSize: Standard_D4s_v3 --- > vmSize: Standard_NC4as_T4_v3
다음 명령을 실행하여 정의 파일에서 GPU 지원 컴퓨팅 머신 세트를 생성합니다.
$ oc create -f machineset-azure-gpu.yaml
출력 예
machineset.machine.openshift.io/myclustername-nc4ast4-gpu-worker-centralus1 created
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 머신 및 머신 세트를 확인합니다. 각 컴퓨팅 머신 세트는 Azure 리전 내의 다른 가용성 영역과 연결되어 있습니다. 설치 프로그램은 가용 영역 전체에 컴퓨팅 시스템을 자동으로 로드합니다.$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE clustername-n6n4r-nc4ast4-gpu-worker-centralus1 1 1 1 1 122m clustername-n6n4r-worker-centralus1 1 1 1 1 8h clustername-n6n4r-worker-centralus2 1 1 1 1 8h clustername-n6n4r-worker-centralus3 1 1 1 1 8h
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 시스템을 확인합니다. 특정 리전 및 영역에서 노드를 추가하기 위해 컴퓨팅 시스템 집합을 확장할 수 있지만 세트당 하나의 컴퓨팅 시스템만 구성할 수 있습니다.$ oc get machines -n openshift-machine-api
출력 예
NAME PHASE TYPE REGION ZONE AGE myclustername-master-0 Running Standard_D8s_v3 centralus 2 6h40m myclustername-master-1 Running Standard_D8s_v3 centralus 1 6h40m myclustername-master-2 Running Standard_D8s_v3 centralus 3 6h40m myclustername-nc4ast4-gpu-worker-centralus1-w9bqn Running centralus 1 21m myclustername-worker-centralus1-rbh6b Running Standard_D4s_v3 centralus 1 6h38m myclustername-worker-centralus2-dbz7w Running Standard_D4s_v3 centralus 2 6h38m myclustername-worker-centralus3-p9b8c Running Standard_D4s_v3 centralus 3 6h38m
다음 명령을 실행하여 기존 노드, 시스템 및 머신 세트를 확인합니다. 각 노드는 특정 Azure 리전 및 OpenShift Container Platform 역할이 있는 머신 정의의 인스턴스입니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION myclustername-master-0 Ready control-plane,master 6h39m v1.26.0 myclustername-master-1 Ready control-plane,master 6h41m v1.26.0 myclustername-master-2 Ready control-plane,master 6h39m v1.26.0 myclustername-nc4ast4-gpu-worker-centralus1-w9bqn Ready worker 14m v1.26.0 myclustername-worker-centralus1-rbh6b Ready worker 6h29m v1.26.0 myclustername-worker-centralus2-dbz7w Ready worker 6h29m v1.26.0 myclustername-worker-centralus3-p9b8c Ready worker 6h31m v1.26.0
컴퓨팅 머신 세트 목록을 표시합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE myclustername-worker-centralus1 1 1 1 1 8h myclustername-worker-centralus2 1 1 1 1 8h myclustername-worker-centralus3 1 1 1 1 8h
다음 명령을 실행하여 정의 파일에서 GPU 지원 컴퓨팅 머신 세트를 생성합니다.
$ oc create -f machineset-azure-gpu.yaml
컴퓨팅 머신 세트 목록을 표시합니다.
oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE myclustername-nc4ast4-gpu-worker-centralus1 1 1 1 1 121m myclustername-worker-centralus1 1 1 1 1 8h myclustername-worker-centralus2 1 1 1 1 8h myclustername-worker-centralus3 1 1 1 1 8h
검증
다음 명령을 실행하여 생성한 머신 세트를 확인합니다.
$ oc get machineset -n openshift-machine-api | grep gpu
MachineSet 복제본 수가
1
로 설정되어 새Machine
오브젝트가 자동으로 생성됩니다.출력 예
myclustername-nc4ast4-gpu-worker-centralus1 1 1 1 1 121m
다음 명령을 실행하여 머신 세트에서 생성된
Machine
오브젝트를 표시합니다.$ oc -n openshift-machine-api get machines | grep gpu
출력 예
myclustername-nc4ast4-gpu-worker-centralus1-w9bqn Running Standard_NC4as_T4_v3 centralus 1 21m
노드의 네임스페이스를 지정할 필요가 없습니다. 노드 정의는 클러스터 범위가 지정되었습니다.
2.3.12. Node Feature Discovery Operator 배포
GPU 지원 노드가 생성되면 예약할 수 있도록 GPU 지원 노드를 검색해야 합니다. 이렇게 하려면 NFD(Node Feature Discovery) Operator를 설치합니다. NFD Operator는 노드의 하드웨어 장치 기능을 식별합니다. OpenShift Container Platform에서 사용할 수 있도록 인프라 노드에서 하드웨어 리소스를 식별하고 카탈로그하는 일반적인 문제를 해결합니다.
절차
- OpenShift Container Platform 콘솔의 OperatorHub 에서 Node Feature Discovery Operator를 설치합니다.
-
OperatorHub 에 NFD Operator를 설치한 후 설치된 Operator 목록에서 Node Feature Discovery 를 선택하고 인스턴스 생성 을 선택합니다. 이렇게 하면
openshift-nfd
네임스페이스에 각 컴퓨팅 노드에 대해nfd-master
및nfd-worker
다음 명령을 실행하여 Operator가 설치되어 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 1d
- 콘솔에서 설치된 Oerator로 이동하여 Create Node Feature Discovery 를 선택합니다.
-
생성 을 선택하여 NFD 사용자 정의 리소스를 빌드합니다. 이렇게 하면
openshift-nfd
네임스페이스에 NFD Pod가 생성되어 OpenShift Container Platform 노드에서 하드웨어 리소스에 대해 폴링하고 카탈로그를 작성합니다.
검증
성공적으로 빌드한 후 다음 명령을 실행하여 NFD Pod가 각 노드에서 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 12d nfd-master-769656c4cb-w9vrv 1/1 Running 0 12d nfd-worker-qjxb2 1/1 Running 3 (3d14h ago) 12d nfd-worker-xtz9b 1/1 Running 5 (3d14h ago) 12d
NFD Operator는 공급 업체 PCI ID를 사용하여 노드에서 하드웨어를 식별합니다. NVIDIA는 PCI ID
10de
를 사용합니다.다음 명령을 실행하여 NFD Operator에서 검색한 NVIDIA GPU를 확인합니다.
$ oc describe node ip-10-0-132-138.us-east-2.compute.internal | egrep 'Roles|pci'
출력 예
Roles: worker feature.node.kubernetes.io/pci-1013.present=true feature.node.kubernetes.io/pci-10de.present=true feature.node.kubernetes.io/pci-1d0f.present=true
10de
는 GPU 지원 노드의 노드 기능 목록에 표시됩니다. 즉, NFD Operator가 GPU 지원 MachineSet에서 노드를 올바르게 식별했습니다.
추가 리소스
2.3.12.1. 기존 Microsoft Azure 클러스터에서 가속 네트워킹 활성화
머신 세트 YAML 파일에 acceleratedNetworking
을 추가하여 Azure에서 Accelerated Networking을 활성화할 수 있습니다.
사전 요구 사항
- 머신 API가 작동하는 기존 Microsoft Azure 클러스터가 있어야 합니다.
절차
providerSpec
필드에 다음을 추가합니다.providerSpec: value: acceleratedNetworking: true 1 vmSize: <azure-vm-size> 2
- 1
- 이 라인은 가속 네트워킹을 활성화합니다.
- 2
- vCPU가 4개 이상인 Azure VM 크기를 지정합니다. VM 크기에 대한 자세한 내용은 Microsoft Azure 설명서를 참조하십시오.
다음 단계
- 현재 실행 중인 노드에서 기능을 활성화하려면 각 기존 머신을 교체해야 합니다. 이 작업은 각 시스템에 대해 개별적으로 수행하거나 복제본을 0으로 축소한 다음 원하는 복제본 수로 백업하여 수행할 수 있습니다.
검증
-
Microsoft Azure 포털에서 머신 세트에서 프로비저닝한 머신의 네트워킹 설정 페이지를 검토하고
가속 네트워킹
필드가Enabled
로 설정되어 있는지 확인합니다.
추가 리소스
2.4. Azure Stack Hub에서 컴퓨팅 머신 세트 생성
Microsoft Azure Stack Hub의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.4.1. Azure Stack Hub에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 1
Microsoft Azure 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role>-<region> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 6 template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <role> 8 machine.openshift.io/cluster-api-machine-type: <role> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 10 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/<role>: "" 11 providerSpec: value: apiVersion: machine.openshift.io/v1beta1 availabilitySet: <availability_set> 12 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api image: offer: "" publisher: "" resourceID: /resourceGroups/<infrastructure_id>-rg/providers/Microsoft.Compute/images/<infrastructure_id> 13 sku: "" version: "" internalLoadBalancer: "" kind: AzureMachineProviderSpec location: <region> 14 managedIdentity: <infrastructure_id>-identity 15 metadata: creationTimestamp: null natRule: null networkResourceGroup: "" osDisk: diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: "" resourceGroup: <infrastructure_id>-rg 16 sshPrivateKey: "" sshPublicKey: "" subnet: <infrastructure_id>-<role>-subnet 17 18 userDataSecret: name: worker-user-data 19 vmSize: Standard_DS4_v2 vnet: <infrastructure_id>-vnet 20 zone: "1" 21
- 1 5 7 13 15 16 17 20
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
다음 명령을 실행하여 서브넷을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.subnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
다음 명령을 실행하여 vnet을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.vnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
- 2 3 8 9 11 18 19
- 추가할 노드 레이블을 지정합니다.
- 4 6 10
- 인프라 ID, 노드 레이블, 리전을 지정합니다.
- 14
- 머신을 배치할 리전을 지정합니다.
- 21
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
- 12
- 클러스터의 가용성 세트를 지정합니다.
2.4.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다. - Azure Stack Hub 컴퓨팅 시스템을 배포할 가용성 세트를 생성합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<
availabilitySet
> , <clusterID
> , <role
> 매개변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.4.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.4.4. Azure 부팅 진단 활성화
머신 세트가 생성하는 Azure 머신에서 부팅 진단을 활성화할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure Stack Hub 클러스터가 있어야 합니다.
절차
머신 세트 YAML 파일의
providerSpec
필드에 스토리지 유형에 적용할 수 있는진단
구성을 추가합니다.Azure Managed 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: AzureManaged 1
- 1
- Azure Managed 스토리지 계정을 지정합니다.
Azure Unmanaged 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: CustomerManaged 1 customerManaged: storageAccountURI: https://<storage-account>.blob.core.windows.net 2
참고Azure Blob Storage 데이터 서비스만 지원됩니다.
검증
- Microsoft Azure 포털에서 머신 세트에서 배포한 머신의 부팅 진단 페이지를 검토하고 머신의 직렬 로그를 확인할 수 있는지 확인합니다.
2.4.5. 머신 세트의 고객 관리 암호화 키 활성화
Azure에 암호화 키를 제공하여 관리 대상 디스크의 데이터를 암호화할 수 있습니다. 시스템 API를 사용하여 고객 관리 키로 서버 측 암호화를 활성화할 수 있습니다.
고객 관리 키를 사용하려면 Azure Key Vault, 디스크 암호화 세트 및 암호화 키가 필요합니다. 디스크 암호화 세트는 CCO(Cloud Credential Operator)에서 권한을 부여한 리소스 그룹에 있어야 합니다. 그렇지 않은 경우 디스크 암호화 세트에 추가 reader 역할을 부여해야 합니다.
절차
머신 세트 YAML 파일의
providerSpec
필드에 설정된 디스크 암호화를 구성합니다. 예를 들면 다음과 같습니다.providerSpec: value: osDisk: diskSizeGB: 128 managedDisk: diskEncryptionSet: id: /subscriptions/<subscription_id>/resourceGroups/<resource_group_name>/providers/Microsoft.Compute/diskEncryptionSets/<disk_encryption_set_name> storageAccountType: Premium_LRS
추가 리소스
2.5. GCP에서 컴퓨팅 머신 세트 생성
GCP(Google Cloud Platform)의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.5.1. GCP에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 GCP(Google Cloud Platform)에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""로 레이블이 지정된 노드를 생성합니다.
여기서 < role
>은 추가할 노드 레이블입니다.
OpenShift CLI를 사용하여 얻은 값
다음 예제에서는 OpenShift CLI를 사용하여 클러스터의 일부 값을 가져올 수 있습니다.
- 인프라 ID
&
lt;infrastructure_id
> 문자열은 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 이미지 경로
&
lt;path_to_image
> 문자열은 디스크를 만드는 데 사용된 이미지의 경로입니다. OpenShift CLI가 설치되어 있으면 다음 명령을 실행하여 이미지에 대한 경로를 얻을 수 있습니다.$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.disks[0].image}{"\n"}' \ get machineset/<infrastructure_id>-worker-a
GCP MachineSet
값 샘플
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-w-a namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-w-a template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-w-a spec: metadata: labels: node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: gcpprovider.openshift.io/v1beta1 canIPForward: false credentialsSecret: name: gcp-cloud-credentials deletionProtection: false disks: - autoDelete: true boot: true image: <path_to_image> 3 labels: null sizeGb: 128 type: pd-ssd gcpMetadata: 4 - key: <custom_metadata_key> value: <custom_metadata_value> kind: GCPMachineProviderSpec machineType: n1-standard-4 metadata: creationTimestamp: null networkInterfaces: - network: <infrastructure_id>-network subnetwork: <infrastructure_id>-worker-subnet projectID: <project_name> 5 region: us-central1 serviceAccounts: 6 - email: <infrastructure_id>-w@<project_name>.iam.gserviceaccount.com scopes: - https://www.googleapis.com/auth/cloud-platform tags: - <infrastructure_id>-worker userDataSecret: name: worker-user-data zone: us-central1-a
- 1
- &
lt;infrastructure_id
>의 경우 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 인프라 ID를 지정합니다. - 2
- &
lt;node&
gt; 의 경우 추가할 노드 레이블을 지정합니다. - 3
- 현재 컴퓨팅 머신 세트에서 사용되는 이미지의 경로를 지정합니다.
GCP Marketplace 이미지를 사용하려면 사용할 오퍼를 지정합니다.
-
OpenShift Container Platform:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-ocp-413-x86-64-202305021736
-
OpenShift Platform Plus:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-opp-413-x86-64-202305021736
-
OpenShift Kubernetes Engine:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-oke-413-x86-64-202305021736
-
OpenShift Container Platform:
- 4
- 선택 사항:
키:값
쌍의 형식으로 사용자 지정 메타데이터를 지정합니다. 예를 들어 사용 사례는 사용자 정의 메타데이터 설정에 대한 GCP 설명서를 참조하십시오. - 5
- &
lt;project_name
>에 대해 클러스터에 사용하는 GCP 프로젝트의 이름을 지정합니다. - 6
- 단일 서비스 계정을 지정합니다. 여러 서비스 계정이 지원되지 않습니다.
2.5.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.5.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.5.4. 머신 세트를 사용하여 영구 디스크 유형 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 머신을 배포하는 영구 디스크의 유형을 구성할 수 있습니다.
영구 디스크 유형, 호환성, 지역 가용성 및 제한 사항에 대한 자세한 내용은 영구 디스크에 대한 GCP Compute Engine 설명서를 참조하십시오.
절차
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드 아래에 다음 행을 편집합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet ... spec: template: spec: providerSpec: value: disks: type: <pd-disk-type> 1
- 1
- 영구 디스크 유형을 지정합니다. 유효한 값은
pd-ssd
,pd-standard
,pd-balanced
입니다. 기본값은pd-standard
입니다.
검증
-
Google Cloud 콘솔을 사용하여 머신 세트에서 배포한 시스템의 세부 정보를 검토하고
Type
필드가 구성된 디스크 유형과 일치하는지 확인합니다.
2.5.5. 머신 세트를 사용하여 기밀성 VM 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 배포된 머신에 사용하는 기밀성 VM 옵션을 구성할 수 있습니다.
기밀성 컴퓨팅 기능, 기능 및 호환성에 대한 자세한 내용은 기밀성 VM에 대한 GCP Compute Engine 설명서를 참조하십시오.
기밀 컴퓨팅은 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
절차
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드에서 다음 섹션을 편집합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet ... spec: template: spec: providerSpec: value: confidentialCompute: Enabled 1 onHostMaintenance: Terminate 2 machineType: n2d-standard-8 3 ...
검증
- Google Cloud 콘솔에서 머신 세트에서 배포한 머신의 세부 정보를 검토하고 기밀성 VM 옵션이 구성한 값과 일치하는지 확인합니다.
2.5.6. 머신을 선점할 수 있는 가상 머신 인스턴스로 배포하는 머신 세트
머신을 보장되지 않는 선점 가능한 가상 머신 인스턴스로 배포하는 GCP에서 실행되는 컴퓨팅 머신 세트를 생성하여 비용을 절감할 수 있습니다. 선점 가능한 가상 머신 인스턴스는 과도한 Compute Engine 용량을 사용하며 일반 인스턴스보다 비용이 저렴합니다. 일괄 처리 또는 상태 비저장, 수평적으로 확장 가능한 워크로드와 같이 인터럽트를 허용할 수있는 워크로드에 선점 가능한 가상 머신 인스턴스를 사용할 수 있습니다.
GCP Compute Engine은 언제든지 선점 가능한 가상 머신 인스턴스를 종료할 수 있습니다. Compute Engine은 인터럽션이 30 초 후에 발생하는 것을 알리는 선점 알림을 사용자에게 보냅니다. OpenShift Container Platform은 Compute Engine이 선점 알림을 발행할 때 영향을 받는 인스턴스에서 워크로드를 제거하기 시작합니다. 인스턴스가 중지되지 않은 경우 ACPI G3 Mechanical Off 신호는 30 초 후에 운영 체제로 전송됩니다. 다음으로 선점 가능한 가상 머신 인스턴스가 Compute Engine에 의해 TERMINATED
상태로 전환됩니다.
다음과 같은 이유로 선점 가능한 가상 머신 인스턴스를 사용할 때 중단될 수 있습니다.
- 시스템 또는 유지 관리 이벤트가 있는 경우
- 선점 가능한 가상 머신 인스턴스의 공급이 감소하는 경우
- 인스턴스가 선점 가능한 가상 머신 인스턴스에 할당된 24 시간 후에 종료되는 경우
GCP가 인스턴스를 종료하면 선점 가능한 가상 머신 인스턴스 노드에서 실행되는 종료 프로세스가 머신 리소스를 삭제합니다. 컴퓨팅 머신 세트 replicas
수량을 충족하기 위해 컴퓨팅 머신 세트는 선점 가능한 가상 머신 인스턴스를 요청하는 머신을 생성합니다.
2.5.6.1. 컴퓨팅 머신 세트를 사용하여 선점 가능한 가상 머신 인스턴스 생성
컴퓨팅 머신 세트 YAML 파일에 preemptible을 추가하여 GCP에서 선점 가능한
가상 머신 인스턴스를 시작할 수 있습니다.
절차
providerSpec
필드 아래에 다음 행을 추가합니다.providerSpec: value: preemptible: true
preemptible
이true
로 설정된 경우 인스턴스가 시작된 후 머신에interruptable-instance
로 레이블이 지정됩니다.
2.5.7. 머신 세트를 사용하여 Shielded VM 옵션 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 배포된 머신에 사용하는 Shielded VM 옵션을 구성할 수 있습니다.
Shielded VM 기능 및 기능에 대한 자세한 내용은 Shielded VM 에 대한 GCP Compute Engine 설명서를 참조하십시오.
절차
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드에서 다음 섹션을 편집합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet ... spec: template: spec: providerSpec: value: shieldedInstanceConfig: 1 integrityMonitoring: Enabled 2 secureBoot: Disabled 3 virtualizedTrustedPlatformModule: Enabled 4 ...
검증
- Google Cloud 콘솔을 사용하여 머신 세트에서 배포한 머신의 세부 정보를 검토하고 중지된 VM 옵션이 구성한 값과 일치하는지 확인합니다.
2.5.8. 머신 세트의 고객 관리 암호화 키 활성화
GCP(Google Cloud Platform) Compute Engine을 사용하면 사용자가 암호화 키를 제공하여 디스크의 데이터를 암호화 할 수 있습니다. 키는 고객의 데이터를 암호화하는 것이 아니라 데이터 암호화 키를 암호화하는 데 사용됩니다. 기본적으로 Compute Engine은 Compute Engine 키를 사용하여 이 데이터를 암호화합니다.
Machine API를 사용하는 클러스터에서 고객 관리 키로 암호화를 활성화할 수 있습니다. 먼저 KMS 키를 생성하고 서비스 계정에 올바른 권한을 할당해야 합니다. 서비스 계정에서 키를 사용하려면 KMS 키 이름, 키 링 이름 및 위치가 필요합니다.
KMS 암호화에 전용 서비스 계정을 사용하지 않는 경우 Compute Engine 기본 서비스 계정이 대신 사용됩니다. 전용 서비스 계정을 사용하지 않는 경우 키에 액세스할 수 있는 기본 서비스 계정 권한을 부여해야 합니다. Compute Engine 기본 서비스 계정 이름은 service-<project_number>@compute-system.iam.gserviceaccount.com
패턴을 기반으로 합니다.
절차
특정 서비스 계정에서 KMS 키를 사용하고 서비스 계정에 올바른 IAM 역할을 부여하려면 KMS 키 이름, 키 링 이름 및 위치로 다음 명령을 실행합니다.
$ gcloud kms keys add-iam-policy-binding <key_name> \ --keyring <key_ring_name> \ --location <key_ring_location> \ --member "serviceAccount:service-<project_number>@compute-system.iam.gserviceaccount.com” \ --role roles/cloudkms.cryptoKeyEncrypterDecrypter
사용자가 머신 세트 YAML 파일의
providerSpec
필드에 암호화 키를 구성할 수 있습니다. 예를 들면 다음과 같습니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet ... spec: template: spec: providerSpec: value: disks: - type: encryptionKey: kmsKey: name: machine-encryption-key 1 keyRing: openshift-encrpytion-ring 2 location: global 3 projectID: openshift-gcp-project 4 kmsKeyServiceAccount: openshift-service-account@openshift-gcp-project.iam.gserviceaccount.com 5
업데이트된
providerSpec
오브젝트 구성을 사용하여 새 머신을 생성하면 디스크 암호화 키가 KMS 키로 암호화됩니다.
2.5.9. 컴퓨팅 머신 세트에 대한 GPU 지원 활성화
GCP(Google Cloud Platform) Compute Engine을 사용하면 사용자가 VM 인스턴스에 GPU를 추가할 수 있습니다. GPU 리소스에 액세스할 수 있는 워크로드는 이 기능이 활성화된 컴퓨팅 머신에서 더 효과적으로 수행할 수 있습니다. GCP의 OpenShift Container Platform은 A2 및 N1 머신 시리즈의 NVIDIA GPU 모델을 지원합니다.
모델 이름 | GPU 유형 | 머신 유형 [1] |
---|---|---|
NVIDIA A100 |
|
|
NVIDIA K80 |
|
|
NVIDIA P100 |
| |
NVIDIA P4 |
| |
NVIDIA T4 |
| |
NVIDIA V100 |
|
- 사양, 호환성, 지역 가용성 및 제한 사항을 포함한 머신 유형에 대한 자세한 내용은 N1 머신 시리즈 ,A2 머신 시리즈 , GPU 지역 및 영역 가용성에 대한 GCP Compute Engine 설명서를 참조하십시오.
Machine API를 사용하여 인스턴스에 사용할 지원되는 GPU를 정의할 수 있습니다.
지원되는 GPU 유형 중 하나로 배포하도록 N1 머신 시리즈에서 머신을 구성할 수 있습니다. A2 머신 시리즈의 머신에는 연결된 GPU가 포함되어 있으며 게스트 가속기를 사용할 수 없습니다.
그래픽 워크로드의 GPU는 지원되지 않습니다.
절차
- 텍스트 편집기에서 기존 컴퓨팅 머신 세트의 YAML 파일을 열고 새 컴퓨팅 머신 세트를 생성합니다.
컴퓨팅 머신 세트 YAML 파일의
providerSpec
필드에 GPU 구성을 지정합니다. 유효한 구성의 다음 예제를 참조하십시오.A2 머신 시리즈의 구성 예:
providerSpec: value: machineType: a2-highgpu-1g 1 onHostMaintenance: Terminate 2 restartPolicy: Always 3
N1 머신 시리즈의 구성 예:
providerSpec: value: gpus: - count: 1 1 type: nvidia-tesla-p100 2 machineType: n1-standard-1 3 onHostMaintenance: Terminate 4 restartPolicy: Always 5
2.5.10. 기존 OpenShift Container Platform 클러스터에 GPU 노드 추가
기본 컴퓨팅 머신 세트 구성을 복사하고 수정하여 GPU 지원 머신 세트 및 GCP 클라우드 공급자의 머신을 생성할 수 있습니다.
다음 표에는 검증된 인스턴스 유형이 나열되어 있습니다.
인스턴스 유형 | NVIDIA GPU 가속기 | 최대 GPU 수 | 아키텍처 |
---|---|---|---|
| A100 | 1 | x86 |
| T4 | 1 | x86 |
절차
-
기존
MachineSet
을 복사합니다. -
새 사본에서
metadata.
의 두 인스턴스 모두 변경합니다.name
의 머신 세트 이름과machine.
openshift.io/cluster-api-machineset 인스턴스 유형을 변경하여 새로 복사한
MachineSet
에 다음 두 행을 추가합니다.machineType: a2-highgpu-1g onHostMaintenance: Terminate
2-highgpu-1g.json
파일의 예{ "apiVersion": "machine.openshift.io/v1beta1", "kind": "MachineSet", "metadata": { "annotations": { "machine.openshift.io/GPU": "0", "machine.openshift.io/memoryMb": "16384", "machine.openshift.io/vCPU": "4" }, "creationTimestamp": "2023-01-13T17:11:02Z", "generation": 1, "labels": { "machine.openshift.io/cluster-api-cluster": "myclustername-2pt9p" }, "name": "myclustername-2pt9p-worker-gpu-a", "namespace": "openshift-machine-api", "resourceVersion": "20185", "uid": "2daf4712-733e-4399-b4b4-d43cb1ed32bd" }, "spec": { "replicas": 1, "selector": { "matchLabels": { "machine.openshift.io/cluster-api-cluster": "myclustername-2pt9p", "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-gpu-a" } }, "template": { "metadata": { "labels": { "machine.openshift.io/cluster-api-cluster": "myclustername-2pt9p", "machine.openshift.io/cluster-api-machine-role": "worker", "machine.openshift.io/cluster-api-machine-type": "worker", "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-gpu-a" } }, "spec": { "lifecycleHooks": {}, "metadata": {}, "providerSpec": { "value": { "apiVersion": "machine.openshift.io/v1beta1", "canIPForward": false, "credentialsSecret": { "name": "gcp-cloud-credentials" }, "deletionProtection": false, "disks": [ { "autoDelete": true, "boot": true, "image": "projects/rhcos-cloud/global/images/rhcos-412-86-202212081411-0-gcp-x86-64", "labels": null, "sizeGb": 128, "type": "pd-ssd" } ], "kind": "GCPMachineProviderSpec", "machineType": "a2-highgpu-1g", "onHostMaintenance": "Terminate", "metadata": { "creationTimestamp": null }, "networkInterfaces": [ { "network": "myclustername-2pt9p-network", "subnetwork": "myclustername-2pt9p-worker-subnet" } ], "preemptible": true, "projectID": "myteam", "region": "us-central1", "serviceAccounts": [ { "email": "myclustername-2pt9p-w@myteam.iam.gserviceaccount.com", "scopes": [ "https://www.googleapis.com/auth/cloud-platform" ] } ], "tags": [ "myclustername-2pt9p-worker" ], "userDataSecret": { "name": "worker-user-data" }, "zone": "us-central1-a" } } } } }, "status": { "availableReplicas": 1, "fullyLabeledReplicas": 1, "observedGeneration": 1, "readyReplicas": 1, "replicas": 1 } }
다음 명령을 실행하여 기존 노드, 시스템 및 머신 세트를 확인합니다. 각 노드는 특정 GCP 리전 및 OpenShift Container Platform 역할이 있는 머신 정의의 인스턴스입니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION myclustername-2pt9p-master-0.c.openshift-qe.internal Ready control-plane,master 8h v1.26.0 myclustername-2pt9p-master-1.c.openshift-qe.internal Ready control-plane,master 8h v1.26.0 myclustername-2pt9p-master-2.c.openshift-qe.internal Ready control-plane,master 8h v1.26.0 myclustername-2pt9p-worker-a-mxtnz.c.openshift-qe.internal Ready worker 8h v1.26.0 myclustername-2pt9p-worker-b-9pzzn.c.openshift-qe.internal Ready worker 8h v1.26.0 myclustername-2pt9p-worker-c-6pbg6.c.openshift-qe.internal Ready worker 8h v1.26.0 myclustername-2pt9p-worker-gpu-a-wxcr6.c.openshift-qe.internal Ready worker 4h35m v1.26.0
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 머신 및 머신 세트를 확인합니다. 각 컴퓨팅 머신 세트는 GCP 리전 내의 다른 가용성 영역과 연결되어 있습니다. 설치 프로그램은 가용 영역 전체에 컴퓨팅 시스템을 자동으로 로드합니다.$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE myclustername-2pt9p-worker-a 1 1 1 1 8h myclustername-2pt9p-worker-b 1 1 1 1 8h myclustername-2pt9p-worker-c 1 1 8h myclustername-2pt9p-worker-f 0 0 8h
다음 명령을 실행하여
openshift-machine-api
네임스페이스에 있는 시스템을 확인합니다. 특정 리전 및 영역에서 노드를 추가하기 위해 컴퓨팅 시스템 집합을 확장할 수 있지만 세트당 하나의 컴퓨팅 시스템만 구성할 수 있습니다.$ oc get machines -n openshift-machine-api | grep worker
출력 예
myclustername-2pt9p-worker-a-mxtnz Running n2-standard-4 us-central1 us-central1-a 8h myclustername-2pt9p-worker-b-9pzzn Running n2-standard-4 us-central1 us-central1-b 8h myclustername-2pt9p-worker-c-6pbg6 Running n2-standard-4 us-central1 us-central1-c 8h
다음 명령을 실행하여 기존 컴퓨팅
MachineSet
정의 중 하나의 사본을 만들고 결과를 JSON 파일로 출력합니다. GPU 지원 컴퓨팅 머신 세트 정의의 기반이 됩니다.$ oc get machineset myclustername-2pt9p-worker-a -n openshift-machine-api -o json > <output_file.json>
JSON 파일을 편집하여 새
MachineSet
정의를 다음과 같이 변경합니다.-
metadata.
에 하위 문자열name
gpu
를 삽입하고machine.openshift.io/cluster-api-machineset
의 두 인스턴스에서 모두 머신 세트 이름의 이름을 변경합니다. 새
MachineSet
정의의machineType
을 NVIDIA A100 GPU를 포함하는2-highgpu-1g
로 변경합니다.jq .spec.template.spec.providerSpec.value.machineType ocp_4.13_machineset-a2-highgpu-1g.json "a2-highgpu-1g"
&
lt;output_file.json
> 파일은ocp_4.13_machineset-a2-highgpu-1g.json
으로 저장됩니다.
-
ocp_4.13_machineset-a2-highgpu-1g.json
필드에서 다음 필드를 업데이트합니다.-
.metadata.name
을gpu
가 포함된 이름으로 변경합니다. -
새
.metadata.name
과 일치하도록.spec.selector.matchLabels["machine.openshift.io/cluster-api-machineset"]
를 변경합니다. -
새
.metadata.name
과 일치하도록.spec.template.metadata.labels["machine.openshift.io/cluster-api-machineset"]
를 변경합니다. -
.spec.template.spec.providerSpec.value.MachineType
을2-highgpu-1g
로 변경합니다. machineType
: ''onHostMaintenance": "Terminate" 아래에 다음 행을 추가합니다. 예를 들면 다음과 같습니다."machineType": "a2-highgpu-1g", "onHostMaintenance": "Terminate",
-
변경 사항을 확인하려면 다음 명령을 실행하여 원래 컴퓨팅 정의와 새 GPU 지원 노드 정의를 수행합니다.
$ oc get machineset/myclustername-2pt9p-worker-a -n openshift-machine-api -o json | diff ocp_4.13_machineset-a2-highgpu-1g.json -
출력 예
15c15 < "name": "myclustername-2pt9p-worker-gpu-a", --- > "name": "myclustername-2pt9p-worker-a", 25c25 < "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-gpu-a" --- > "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-a" 34c34 < "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-gpu-a" --- > "machine.openshift.io/cluster-api-machineset": "myclustername-2pt9p-worker-a" 59,60c59 < "machineType": "a2-highgpu-1g", < "onHostMaintenance": "Terminate", --- > "machineType": "n2-standard-4",
다음 명령을 실행하여 정의 파일에서 GPU 지원 컴퓨팅 머신 세트를 생성합니다.
$ oc create -f ocp_4.13_machineset-a2-highgpu-1g.json
출력 예
machineset.machine.openshift.io/myclustername-2pt9p-worker-gpu-a created
검증
다음 명령을 실행하여 생성한 머신 세트를 확인합니다.
$ oc -n openshift-machine-api get machinesets | grep gpu
MachineSet 복제본 수가
1
로 설정되어 새Machine
오브젝트가 자동으로 생성됩니다.출력 예
myclustername-2pt9p-worker-gpu-a 1 1 1 1 5h24m
다음 명령을 실행하여 머신 세트에서 생성된
Machine
오브젝트를 표시합니다.$ oc -n openshift-machine-api get machines | grep gpu
출력 예
myclustername-2pt9p-worker-gpu-a-wxcr6 Running a2-highgpu-1g us-central1 us-central1-a 5h25m
노드의 네임스페이스를 지정할 필요가 없습니다. 노드 정의는 클러스터 범위가 지정되었습니다.
2.5.11. Node Feature Discovery Operator 배포
GPU 지원 노드가 생성되면 예약할 수 있도록 GPU 지원 노드를 검색해야 합니다. 이렇게 하려면 NFD(Node Feature Discovery) Operator를 설치합니다. NFD Operator는 노드의 하드웨어 장치 기능을 식별합니다. OpenShift Container Platform에서 사용할 수 있도록 인프라 노드에서 하드웨어 리소스를 식별하고 카탈로그하는 일반적인 문제를 해결합니다.
절차
- OpenShift Container Platform 콘솔의 OperatorHub 에서 Node Feature Discovery Operator를 설치합니다.
-
OperatorHub 에 NFD Operator를 설치한 후 설치된 Operator 목록에서 Node Feature Discovery 를 선택하고 인스턴스 생성 을 선택합니다. 이렇게 하면
openshift-nfd
네임스페이스에 각 컴퓨팅 노드에 대해nfd-master
및nfd-worker
다음 명령을 실행하여 Operator가 설치되어 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 1d
- 콘솔에서 설치된 Oerator로 이동하여 Create Node Feature Discovery 를 선택합니다.
-
생성 을 선택하여 NFD 사용자 정의 리소스를 빌드합니다. 이렇게 하면
openshift-nfd
네임스페이스에 NFD Pod가 생성되어 OpenShift Container Platform 노드에서 하드웨어 리소스에 대해 폴링하고 카탈로그를 작성합니다.
검증
성공적으로 빌드한 후 다음 명령을 실행하여 NFD Pod가 각 노드에서 실행되고 있는지 확인합니다.
$ oc get pods -n openshift-nfd
출력 예
NAME READY STATUS RESTARTS AGE nfd-controller-manager-8646fcbb65-x5qgk 2/2 Running 7 (8h ago) 12d nfd-master-769656c4cb-w9vrv 1/1 Running 0 12d nfd-worker-qjxb2 1/1 Running 3 (3d14h ago) 12d nfd-worker-xtz9b 1/1 Running 5 (3d14h ago) 12d
NFD Operator는 공급 업체 PCI ID를 사용하여 노드에서 하드웨어를 식별합니다. NVIDIA는 PCI ID
10de
를 사용합니다.다음 명령을 실행하여 NFD Operator에서 검색한 NVIDIA GPU를 확인합니다.
$ oc describe node ip-10-0-132-138.us-east-2.compute.internal | egrep 'Roles|pci'
출력 예
Roles: worker feature.node.kubernetes.io/pci-1013.present=true feature.node.kubernetes.io/pci-10de.present=true feature.node.kubernetes.io/pci-1d0f.present=true
10de
는 GPU 지원 노드의 노드 기능 목록에 표시됩니다. 즉, NFD Operator가 GPU 지원 MachineSet에서 노드를 올바르게 식별했습니다.
2.6. IBM Cloud에서 컴퓨팅 머신 세트 생성
IBM Cloud의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.6.1. IBM Cloud에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 지정된 IBM Cloud 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role>-<region> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <role> 8 machine.openshift.io/cluster-api-machine-type: <role> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 10 spec: metadata: labels: node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: ibmcloudproviderconfig.openshift.io/v1beta1 credentialsSecret: name: ibmcloud-credentials image: <infrastructure_id>-rhcos 11 kind: IBMCloudMachineProviderSpec primaryNetworkInterface: securityGroups: - <infrastructure_id>-sg-cluster-wide - <infrastructure_id>-sg-openshift-net subnet: <infrastructure_id>-subnet-compute-<zone> 12 profile: <instance_profile> 13 region: <region> 14 resourceGroup: <resource_group> 15 userDataSecret: name: <role>-user-data 16 vpc: <vpc_name> 17 zone: <zone> 18
- 1 5 7
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9 16
- 추가할 노드 레이블입니다.
- 4 6 10
- 인프라 ID, 노드 레이블 및 리전.
- 11
- 클러스터 설치에 사용된 사용자 지정 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지입니다.
- 12
- 시스템을 배치할 리전 내 인프라 ID 및 영역입니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
- 13
- IBM Cloud 인스턴스 프로필을 지정합니다.
- 14
- 머신을 배치할 리전을 지정합니다.
- 15
- 시스템 리소스가 배치되는 리소스 그룹입니다. 이는 설치 시 지정된 기존 리소스 그룹 또는 인프라 ID를 기반으로 이름이 지정된 설치 관리자 생성 리소스 그룹입니다.
- 17
- VPC 이름입니다.
- 18
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
2.6.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.6.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.7. IBM Power Virtual Server에서 컴퓨팅 머신 세트 생성
IBM Power Virtual Server의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.7.1. IBM Power Virtual Server에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML 파일은 리전의 지정된 IBM Power Virtual Server 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 생성합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role>-<region> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <role> 8 machine.openshift.io/cluster-api-machine-type: <role> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<region> 10 spec: metadata: labels: node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: machine.openshift.io/v1 credentialsSecret: name: powervs-credentials image: name: rhcos-<infrastructure_id> 11 type: Name keyPairName: <infrastructure_id>-key kind: PowerVSMachineProviderConfig memoryGiB: 32 network: regex: ^DHCPSERVER[0-9a-z]{32}_Private$ type: RegEx processorType: Shared processors: "0.5" serviceInstance: id: <ibm_power_vs_service_instance_id> type: ID 12 systemType: s922 userDataSecret: name: <role>-user-data
- 1 5 7
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9
- 추가할 노드 레이블입니다.
- 4 6 10
- 인프라 ID, 노드 레이블 및 리전.
- 11
- 클러스터 설치에 사용된 사용자 지정 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지입니다.
- 12
- 머신을 배치할 리전 내 인프라 ID입니다.
2.7.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.7.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.8. Nutanix에서 컴퓨팅 머신 세트 생성
Nutanix의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.8.1. Nutanix에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 생성하는 Nutanix 컴퓨팅 머신 세트를 정의합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
OpenShift CLI를 사용하여 얻은 값
다음 예제에서는 OpenShift CLI(oc
)를 사용하여 클러스터의 일부 값을 가져올 수 있습니다.
- 인프라 ID
&
lt;infrastructure_id
> 문자열은 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> name: <infrastructure_id>-<role>-<zone> 3 namespace: openshift-machine-api annotations: 4 machine.openshift.io/memoryMb: "16384" machine.openshift.io/vCPU: "4" spec: replicas: 3 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role>-<zone> spec: metadata: labels: node-role.kubernetes.io/<role>: "" providerSpec: value: apiVersion: machine.openshift.io/v1 bootType: "" 5 categories: 6 - key: <category_name> value: <category_value> cluster: 7 type: uuid uuid: <cluster_uuid> credentialsSecret: name: nutanix-credentials image: name: <infrastructure_id>-rhcos 8 type: name kind: NutanixMachineProviderConfig memorySize: 16Gi 9 project: 10 type: name name: <project_name> subnets: - type: uuid uuid: <subnet_uuid> systemDiskSize: 120Gi 11 userDataSecret: name: <user_data_secret> 12 vcpuSockets: 4 13 vcpusPerSocket: 1 14
- 1
- &
lt;infrastructure_id
>의 경우 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 인프라 ID를 지정합니다. - 2
- 추가할 노드 레이블을 지정합니다.
- 3
- 인프라 ID, 노드 레이블 및 영역을 지정합니다.
- 4
- 클러스터 자동 스케일러의 주석입니다.
- 5
- 컴퓨팅 시스템에서 사용하는 부팅 유형을 지정합니다. 부팅 유형에 대한 자세한 내용은 가상화 된 환경에서 UEFI, Secure Boot 및 TPM 이해를 참조하십시오. 유효한 값은
레거시
,SecureBoot
또는UEFI
입니다. 기본값은레거시
입니다.참고OpenShift Container Platform 4.13에서
레거시
부팅 유형을 사용해야 합니다. - 6
- 컴퓨팅 머신에 적용할 하나 이상의 Nutanix Prism 카테고리를 지정합니다. 이 스탠자에는 Prism Central에 존재하는 카테고리 키-값 쌍에 대한
key
및value
매개변수가 필요합니다. 카테고리에 대한 자세한 내용은 카테고리 관리를 참조하십시오. - 7
- Nutanix Prism Element 클러스터 구성을 지정합니다. 이 예에서 클러스터 유형은
uuid
이므로uuid
스탠자가 있습니다. - 8
- 사용할 이미지를 지정합니다. 클러스터에 대한 기존 기본 컴퓨팅 시스템 세트의 이미지를 사용합니다.
- 9
- Gi에서 클러스터의 메모리 크기를 지정합니다.
- 10
- 클러스터에 사용하는 Nutanix 프로젝트를 지정합니다. 이 예에서 프로젝트 유형은
name
이므로name
스탠자가 있습니다. - 11
- Gi에서 시스템 디스크의 크기를 지정합니다.
- 12
openshift-machine-api
네임스페이스에 있는 사용자 데이터 YAML 파일에서 시크릿 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.- 13
- vCPU 소켓 수를 지정합니다.
- 14
- 소켓당 vCPU 수를 지정합니다.
2.8.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.8.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.9. OpenStack에서 컴퓨팅 머신 세트 생성
Red Hat OpenStack Platform (RHOSP)의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.9.1. RHOSP에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 RHOSP(Red Hat OpenStack Platform)에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role> 4 namespace: openshift-machine-api spec: replicas: <number_of_replicas> selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <role> 8 machine.openshift.io/cluster-api-machine-type: <role> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 10 spec: providerSpec: value: apiVersion: openstackproviderconfig.openshift.io/v1alpha1 cloudName: openstack cloudsSecret: name: openstack-cloud-credentials namespace: openshift-machine-api flavor: <nova_flavor> image: <glance_image_name_or_location> serverGroupID: <optional_UUID_of_server_group> 11 kind: OpenstackProviderSpec networks: 12 - filter: {} subnets: - filter: name: <subnet_name> tags: openshiftClusterID=<infrastructure_id> 13 primarySubnet: <rhosp_subnet_UUID> 14 securityGroups: - filter: {} name: <infrastructure_id>-worker 15 serverMetadata: Name: <infrastructure_id>-worker 16 openshiftClusterID: <infrastructure_id> 17 tags: - openshiftClusterID=<infrastructure_id> 18 trunk: true userDataSecret: name: worker-user-data 19 availabilityZone: <optional_openstack_availability_zone>
- 1 5 7 13 15 16 17 18
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9 19
- 추가할 노드 레이블을 지정합니다.
- 4 6 10
- 인프라 ID 및 노드 레이블을 지정합니다.
- 11
- MachineSet의 서버 그룹 정책을 설정하려면, 서버 그룹 생성에서 반환된 값을 입력합니다. 대부분의 배포에는
anti-affinity
또는soft-anti-affinity
정책이 권장됩니다. - 12
- 여러 네트워크에 배포해야 합니다. 여러 네트워크를 지정하려면 네트워크 배열에 다른 항목을 추가합니다. 또한
primarySubnet
값으로 사용되는 네트워크를 포함해야 합니다. - 14
- 노드 엔드포인트를 게시할 RHOSP 서브넷을 지정합니다. 일반적으로 이 서브넷은
install-config.yaml
파일에서machineSubnet
값으로 사용되는 서브넷과 동일합니다.
2.9.2. RHOSP에서 SR-IOV를 사용하는 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
SR-IOV(Single-root I/O Virtualization)용으로 클러스터를 구성한 경우 해당 기술을 사용하는 컴퓨팅 머신 세트를 생성할 수 있습니다.
이 샘플 YAML은 SR-IOV 네트워크를 사용하는 컴퓨팅 머신 세트를 정의합니다. 생성된 노드에는 node-role.openshift.io/<node_role>: ""
로 레이블이 지정됩니다.
이 샘플에서 infrastructure_id
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 node_role
은 추가할 노드 레이블입니다.
이 샘플은 "radio" 및 "uplink"라는 두 개의 SR-IOV 네트워크를 가정합니다. 네트워크는 spec.template.spec.providerSpec.value.ports
목록의 포트 정의에 사용됩니다.
SR-IOV 배포와 관련된 매개변수만 이 샘플에 설명되어 있습니다. 더 일반적인 샘플을 검토하려면 "RHOSP에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML"을 참조하십시오.
SR-IOV 네트워크를 사용하는 컴퓨팅 머신 세트의 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <node_role> machine.openshift.io/cluster-api-machine-type: <node_role> name: <infrastructure_id>-<node_role> namespace: openshift-machine-api spec: replicas: <number_of_replicas> selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<node_role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <node_role> machine.openshift.io/cluster-api-machine-type: <node_role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<node_role> spec: metadata: providerSpec: value: apiVersion: openstackproviderconfig.openshift.io/v1alpha1 cloudName: openstack cloudsSecret: name: openstack-cloud-credentials namespace: openshift-machine-api flavor: <nova_flavor> image: <glance_image_name_or_location> serverGroupID: <optional_UUID_of_server_group> kind: OpenstackProviderSpec networks: - subnets: - UUID: <machines_subnet_UUID> ports: - networkID: <radio_network_UUID> 1 nameSuffix: radio fixedIPs: - subnetID: <radio_subnet_UUID> 2 tags: - sriov - radio vnicType: direct 3 portSecurity: false 4 - networkID: <uplink_network_UUID> 5 nameSuffix: uplink fixedIPs: - subnetID: <uplink_subnet_UUID> 6 tags: - sriov - uplink vnicType: direct 7 portSecurity: false 8 primarySubnet: <machines_subnet_UUID> securityGroups: - filter: {} name: <infrastructure_id>-<node_role> serverMetadata: Name: <infrastructure_id>-<node_role> openshiftClusterID: <infrastructure_id> tags: - openshiftClusterID=<infrastructure_id> trunk: true userDataSecret: name: <node_role>-user-data availabilityZone: <optional_openstack_availability_zone>
SR-IOV를 사용할 수 있는 컴퓨팅 머신을 배포한 후 다음과 같이 라벨을 지정해야 합니다. 예를 들어 명령줄에서 다음을 입력합니다.
$ oc label node <NODE_NAME> feature.node.kubernetes.io/network-sriov.capable="true"
네트워크 및 서브넷 목록의 항목을 통해 생성된 포트에 대해 트렁킹이 활성화됩니다. 이러한 목록에서 생성된 포트의 이름은 <machine_name>-<nameSuffix>
패턴을 따릅니다. nameSuffix
필드는 포트 정의에 필요합니다.
각 포트에 대해 트렁킹을 활성화할 수 있습니다.
선택적으로 태그 목록의 일부로 포트에 tags
를 추가할 수 있습니다.
2.9.3. 포트 보안이 비활성화된 SR-IOV 배포를 위한 샘플 YAML
포트 보안이 비활성화된 네트워크에서 SR-IOV(Single-root I/O virtualization) 포트를 생성하려면 포트를 spec.template.spec.providerSpec.value.ports
목록의 항목으로 포함하는 컴퓨팅 머신 세트를 정의합니다. 표준 SR-IOV 컴퓨팅 머신 세트와의 차이점은 네트워크 및 서브넷 인터페이스를 사용하여 생성되는 포트에 대해 발생하는 자동 보안 그룹 및 허용된 주소 쌍 구성으로 인해 발생합니다.
머신 서브넷에 대해 정의한 포트에는 다음이 필요합니다.
- API 및 ingress 가상 IP 포트에 허용되는 주소 쌍
- 컴퓨팅 보안 그룹
- 머신 네트워크 및 서브넷에 연결
포트 보안이 비활성화된 SR-IOV 배포와 관련된 매개변수만 이 샘플에 설명되어 있습니다. 더 일반적인 샘플을 검토하려면 RHOSP에서 SR-IOV를 사용하는 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML을 참조하십시오.
SR-IOV 네트워크를 사용하고 포트 보안이 비활성화된 예제 컴퓨팅 머신 세트
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <node_role> machine.openshift.io/cluster-api-machine-type: <node_role> name: <infrastructure_id>-<node_role> namespace: openshift-machine-api spec: replicas: <number_of_replicas> selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<node_role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <node_role> machine.openshift.io/cluster-api-machine-type: <node_role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<node_role> spec: metadata: {} providerSpec: value: apiVersion: openstackproviderconfig.openshift.io/v1alpha1 cloudName: openstack cloudsSecret: name: openstack-cloud-credentials namespace: openshift-machine-api flavor: <nova_flavor> image: <glance_image_name_or_location> kind: OpenstackProviderSpec ports: - allowedAddressPairs: 1 - ipAddress: <API_VIP_port_IP> - ipAddress: <ingress_VIP_port_IP> fixedIPs: - subnetID: <machines_subnet_UUID> 2 nameSuffix: nodes networkID: <machines_network_UUID> 3 securityGroups: - <compute_security_group_UUID> 4 - networkID: <SRIOV_network_UUID> nameSuffix: sriov fixedIPs: - subnetID: <SRIOV_subnet_UUID> tags: - sriov vnicType: direct portSecurity: False primarySubnet: <machines_subnet_UUID> serverMetadata: Name: <infrastructure_ID>-<node_role> openshiftClusterID: <infrastructure_id> tags: - openshiftClusterID=<infrastructure_id> trunk: false userDataSecret: name: worker-user-data
네트워크 및 서브넷 목록의 항목을 통해 생성된 포트에 대해 트렁킹이 활성화됩니다. 이러한 목록에서 생성된 포트의 이름은 <machine_name>-<nameSuffix>
패턴을 따릅니다. nameSuffix
필드는 포트 정의에 필요합니다.
각 포트에 대해 트렁킹을 활성화할 수 있습니다.
선택적으로 태그 목록의 일부로 포트에 tags
를 추가할 수 있습니다.
클러스터가 Kuryr를 사용하고 RHOSP SR-IOV 네트워크에 포트 보안이 비활성화된 경우 컴퓨팅 머신의 기본 포트에는 다음이 있어야 합니다.
-
spec.template.spec.providerSpec.value.networks.portSecurityEnabled
매개변수의 값이false
로 설정됩니다. -
각 서브넷의
spec.template.spec.providerSpec.value.networks.portSecurityEnabled
매개변수 값이false
로 설정됩니다. -
spec.template.spec.providerSpec.value.securityGroups
값이 empty:[]
로 설정됩니다.
SR-IOV를 사용하고 포트 보안이 비활성화된 Kuryr의 클러스터에 대한 컴퓨팅 머신 세트의 예제 섹션
... networks: - subnets: - uuid: <machines_subnet_UUID> portSecurityEnabled: false portSecurityEnabled: false securityGroups: [] ...
이 경우 VM이 생성된 후 컴퓨팅 보안 그룹을 기본 VM 인터페이스에 적용할 수 있습니다. 예를 들어 명령줄에서 다음을 수행합니다.
$ openstack port set --enable-port-security --security-group <infrastructure_id>-<node_role> <main_port_ID>
SR-IOV를 사용할 수 있는 컴퓨팅 머신을 배포한 후 다음과 같이 라벨을 지정해야 합니다. 예를 들어 명령줄에서 다음을 입력합니다.
$ oc label node <NODE_NAME> feature.node.kubernetes.io/network-sriov.capable="true"
2.9.4. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.9.5. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.10. RHV에서 컴퓨팅 머신 세트 생성
RHV(Red Hat Virtualization)의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.10.1. RHV에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 RHV에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<node_role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role> 4 namespace: openshift-machine-api spec: replicas: <number_of_replicas> 5 Selector: 6 matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 8 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 9 machine.openshift.io/cluster-api-machine-role: <role> 10 machine.openshift.io/cluster-api-machine-type: <role> 11 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 12 spec: metadata: labels: node-role.kubernetes.io/<role>: "" 13 providerSpec: value: apiVersion: ovirtproviderconfig.machine.openshift.io/v1beta1 cluster_id: <ovirt_cluster_id> 14 template_name: <ovirt_template_name> 15 sparse: <boolean_value> 16 format: <raw_or_cow> 17 cpu: 18 sockets: <number_of_sockets> 19 cores: <number_of_cores> 20 threads: <number_of_threads> 21 memory_mb: <memory_size> 22 guaranteed_memory_mb: <memory_size> 23 os_disk: 24 size_gb: <disk_size> 25 storage_domain_id: <storage_domain_UUID> 26 network_interfaces: 27 vnic_profile_id: <vnic_profile_id> 28 credentialsSecret: name: ovirt-credentials 29 kind: OvirtMachineProviderSpec type: <workload_type> 30 auto_pinning_policy: <auto_pinning_policy> 31 hugepages: <hugepages> 32 affinityGroupsNames: - compute 33 userDataSecret: name: worker-user-data
- 1 7 9
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 10 11 13
- 추가할 노드 레이블을 지정합니다.
- 4 8 12
- 인프라 ID 및 노드 레이블을 지정합니다. 이 두 문자열은 35자를 초과할 수 없습니다.
- 5
- 생성할 머신 수를 지정합니다.
- 6
- 머신의 선택기입니다.
- 14
- 이 VM 인스턴스가 속하는 RHV 클러스터의 UUID를 지정합니다.
- 15
- 머신을 생성하는 데 사용할 RHV VM 템플릿을 지정합니다.
- 16
- 이 옵션을
false
로 설정하면 디스크를 사전 할당할 수 있습니다. 기본값은true
입니다.원시
로 설정된형식을
true
로 설정하여스파
스를 true로 설정하는 것은 블록 스토리지 도메인에는 사용할 수 없습니다.raw
형식은 전체 가상 디스크를 기본 물리 디스크에 씁니다. - 17
- ss 또는
raw
로설정할
수 있습니다. 기본값은 sac입니다
. 소란형식은
가상 머신에 최적화되어 있습니다.참고파일 스토리지 도메인에서 디스크를 사전 할당하면 파일에 0을 씁니다. 실제로 기본 스토리지에 따라 디스크를 사전 할당하지 않을 수 있습니다.
- 18
- 선택 사항: CPU 필드에 소켓, 코어 및 스레드를 포함한 CPU 구성이 포함되어 있습니다.
- 19
- 선택 사항: VM의 소켓 수를 지정합니다.
- 20
- 선택 사항: 소켓당 코어 수를 지정합니다.
- 21
- 선택 사항: 코어당 스레드 수를 지정합니다.
- 22
- 선택 사항: VM의 메모리 크기를 MiB로 지정합니다.
- 23
- 선택 사항: 가상 머신의 보장된 메모리 크기를 MiB로 지정합니다. 이는 ballooning 메커니즘에 의해 드레이닝되지 않도록 보장되는 메모리 양입니다. 자세한 내용은 설명 된 메모리 설정 및 최적화 설정을 참조하십시오.참고
RHV 4.4.8 이전 버전을 사용하는 경우 Red Hat Virtualization 클러스터에서 OpenShift에 대한 Guaranteed 메모리 요구 사항을 참조하십시오.
- 24
- 선택사항: 노드의 루트 디스크입니다.
- 25
- 선택사항: 부팅 가능한 디스크 크기를 GiB로 지정합니다.
- 26
- 선택 사항: 컴퓨팅 노드 디스크의 스토리지 도메인의 UUID를 지정합니다. 제공되지 않으면 compute 노드가 컨트롤 노드와 동일한 스토리지 도메인에서 생성됩니다. (기본값)
- 27
- 선택사항: VM의 네트워크 인터페이스 목록입니다. 이 매개변수를 포함하는 경우 OpenShift Container Platform은 템플릿에서 모든 네트워크 인터페이스를 삭제하고 새 네트워크 인터페이스를 생성합니다.
- 28
- 선택사항: vNIC 프로필 ID를 지정합니다.
- 29
- RHV 인증 정보를 보유한 보안 오브젝트의 이름을 지정합니다.
- 30
- 선택 사항: 인스턴스가 최적화된 워크로드 유형을 지정합니다. 이 값은
RHV VM
매개변수에 영향을 미칩니다. 지원되는 값은desktop
,server
(기본값),high_performance
입니다.high_performance
는 VM의 성능을 향상시킵니다. 제한 사항은 예를 들어 그래픽 콘솔을 사용하여 VM에 액세스할 수 없습니다. 자세한 내용은 가상 머신 관리 가이드에서 고성능 가상 머신, 템플릿 및 풀 구성을 참조하십시오. - 31
- 선택 사항: AutoPinningPolicy는 이 인스턴스의 호스트에 고정을 포함하여 CPU 및 NUMA 설정을 자동으로 설정하는 정책을 정의합니다. 지원되는 값:
none
,resize_and_pin
. 자세한 내용은 가상 머신 관리 가이드에서 NUMA 노드 설정을 참조하십시오. - 32
- 선택 사항: Hugepages는 VM에서 hugepages를 정의하는 KiB 크기입니다. 지원되는 값:
2048
또는1048576
. 자세한 내용은 가상 머신 관리 가이드에서 Huge Pages 구성을 참조하십시오. - 33
- 선택 사항: VM에 적용할 선호도 그룹 이름 목록입니다. 선호도 그룹은 oVirt에 있어야 합니다.
RHV는 VM을 생성할 때 템플릿을 사용하므로 선택적 매개변수에 대한 값을 지정하지 않으면 RHV는 템플릿에 지정된 해당 매개변수의 값을 사용합니다.
2.10.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.11. vSphere에서 컴퓨팅 머신 세트 생성
VMware vSphere의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.11.1. vSphere에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 VMware vSphere에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 3 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 4 template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machine-role: <role> 6 machine.openshift.io/cluster-api-machine-type: <role> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 8 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/<role>: "" 9 providerSpec: value: apiVersion: vsphereprovider.openshift.io/v1beta1 credentialsSecret: name: vsphere-cloud-credentials diskGiB: 120 kind: VSphereMachineProviderSpec memoryMiB: 8192 metadata: creationTimestamp: null network: devices: - networkName: "<vm_network_name>" 10 numCPUs: 4 numCoresPerSocket: 1 snapshot: "" template: <vm_template_name> 11 userDataSecret: name: worker-user-data workspace: datacenter: <vcenter_datacenter_name> 12 datastore: <vcenter_datastore_name> 13 folder: <vcenter_vm_folder_path> 14 resourcepool: <vsphere_resource_pool> 15 server: <vcenter_server_ip> 16
- 1 3 5
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 4 8
- 인프라 ID 및 노드 레이블을 지정합니다.
- 6 7 9
- 추가할 노드 레이블을 지정합니다.
- 10
- 컴퓨팅 머신 세트를 배포할 vSphere VM 네트워크를 지정합니다. 이 VM 네트워크는 클러스터에 다른 컴퓨팅 시스템이 상주하는 위치여야 합니다.
- 11
- 사용할 vSphere VM 템플릿 (예:
user-5ddjd-rhcos)
을 지정합니다. - 12
- 컴퓨팅 머신 세트를 배포할 vCenter Datacenter를 지정합니다.
- 13
- 컴퓨팅 머신 세트를 배포할 vCenter Datastore를 지정합니다.
- 14
- vCenter의 vSphere VM 폴더에 경로(예:
/dc1/vm/user-inst-5ddjd
)를 지정합니다. - 15
- VM의 vSphere 리소스 풀을 지정합니다.
- 16
- vCenter 서버 IP 또는 정규화된 도메인 이름을 지정합니다.
2.11.2. 컴퓨팅 머신 세트 관리에 필요한 최소 vCenter 권한
vCenter의 OpenShift Container Platform 클러스터에서 컴퓨팅 머신 세트를 관리하려면 권한이 있는 계정을 사용하여 필요한 리소스를 읽고, 생성하고, 삭제해야 합니다. 필요한 모든 권한에 액세스할 수 있는 가장 간단한 방법은 글로벌 관리 권한이 있는 계정을 사용하는 것입니다.
글로벌 관리 권한이 있는 계정을 사용할 수 없는 경우 필요한 최소 권한을 부여하려면 역할을 생성해야 합니다. 다음 표에는 컴퓨팅 머신 세트를 생성, 스케일링, 삭제하고 OpenShift Container Platform 클러스터에서 머신을 삭제하는 데 필요한 최소 vCenter 역할 및 권한이 나와 있습니다.
예 2.1. 컴퓨팅 머신 세트 관리에 필요한 최소 vCenter 역할 및 권한
역할의 vSphere 개체 | 필요한 경우 | 필요한 권한 |
---|---|---|
vSphere vCenter | Always |
|
vSphere vCenter Cluster | Always |
|
vSphere Datastore | Always |
|
vSphere Port Group | Always |
|
가상 머신 폴더 | Always |
|
vSphere vCenter Datacenter | 설치 프로그램이 가상 머신 폴더를 생성하는 경우 |
|
1 |
다음 표에서는 컴퓨팅 머신 세트 관리에 필요한 권한 및 권한 부여 설정에 대해 자세히 설명합니다.
예 2.2. 필수 권한 및 권한 부여 설정
vSphere 오브젝트 | 폴더 유형 | 하위 항목으로 권한 부여 | 권한 필요 |
---|---|---|---|
vSphere vCenter | Always | 필요하지 않음 | 나열된 필수 권한 |
vSphere vCenter Datacenter | 기존 폴더 | 필요하지 않음 |
|
설치 프로그램은 폴더를 생성 | 필수 항목 | 나열된 필수 권한 | |
vSphere vCenter Cluster | Always | 필수 항목 | 나열된 필수 권한 |
vSphere vCenter Datastore | Always | 필요하지 않음 | 나열된 필수 권한 |
vSphere Switch | Always | 필요하지 않음 |
|
vSphere Port Group | Always | 필요하지 않음 | 나열된 필수 권한 |
vSphere vCenter Virtual Machine Folder | 기존 폴더 | 필수 항목 | 나열된 필수 권한 |
필요한 권한만으로 계정을 생성하는 방법에 대한 자세한 내용은 vSphere 문서에서 vSphere 권한 및 사용자 관리 작업을 참조하십시오.
2.11.3. 컴퓨팅 머신 세트를 사용하는 사용자 프로비저닝 인프라가 있는 클러스터의 요구사항
사용자 프로비저닝 인프라가 있는 클러스터에서 컴퓨팅 머신 세트를 사용하려면 Machine API를 사용하여 클러스터 구성을 지원해야 합니다.
인프라 ID 가져오기
컴퓨팅 머신 세트를 생성하려면 클러스터의 인프라 ID를 제공할 수 있어야 합니다.
절차
클러스터의 인프라 ID를 가져오려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.infrastructureName}'
vSphere 인증 정보 요구 사항 충족
컴퓨팅 머신 세트를 사용하려면 Machine API가 vCenter와 상호 작용할 수 있어야 합니다. Machine API 구성 요소가 vCenter와 상호 작용하도록 권한을 부여하는 인증 정보는 openshift-machine-api
네임스페이스의 시크릿에 있어야 합니다.
절차
필요한 인증 정보가 있는지 확인하려면 다음 명령을 실행합니다.
$ oc get secret \ -n openshift-machine-api vsphere-cloud-credentials \ -o go-template='{{range $k,$v := .data}}{{printf "%s: " $k}}{{if not $v}}{{$v}}{{else}}{{$v | base64decode}}{{end}}{{"\n"}}{{end}}'
샘플 출력
<vcenter-server>.password=<openshift-user-password> <vcenter-server>.username=<openshift-user>
여기서 <
vcenter-server
>는 vCenter 서버 및 <openshift-user
>의 IP 주소 또는 정규화된 도메인 이름(FQDN)이고 <openshift-user-password
>는 사용할 OpenShift Container Platform 관리자 자격 증명입니다.시크릿이 없는 경우 다음 명령을 실행하여 시크릿을 생성합니다.
$ oc create secret generic vsphere-cloud-credentials \ -n openshift-machine-api \ --from-literal=<vcenter-server>.username=<openshift-user> --from-literal=<vcenter-server>.password=<openshift-user-password>
Ignition 구성 요구 사항 충족
VM(가상 머신)을 프로비저닝하려면 유효한 Ignition 구성이 필요합니다. Ignition 구성에는 Machine Config Operator에서 추가 Ignition 구성을 가져오기 위한 machine-config-server
주소와 시스템 신뢰 번들이 포함되어 있습니다.
기본적으로 이 구성은 machine-api-operator
네임스페이스의 worker-user-data
시크릿에 저장됩니다. 컴퓨팅 머신 세트는 머신 생성 프로세스 중 시크릿을 참조합니다.
절차
필요한 보안이 존재하는지 확인하려면 다음 명령을 실행합니다.
$ oc get secret \ -n openshift-machine-api worker-user-data \ -o go-template='{{range $k,$v := .data}}{{printf "%s: " $k}}{{if not $v}}{{$v}}{{else}}{{$v | base64decode}}{{end}}{{"\n"}}{{end}}'
샘플 출력
disableTemplating: false userData: 1 { "ignition": { ... }, ... }
- 1
- 전체 출력은 여기에서 생략되지만 이 형식이 있어야 합니다.
시크릿이 없는 경우 다음 명령을 실행하여 시크릿을 생성합니다.
$ oc create secret generic worker-user-data \ -n openshift-machine-api \ --from-file=<installation_directory>/worker.ign
여기서
<installation_directory
>는 클러스터 설치 중에 설치 자산을 저장하는 데 사용된 디렉터리입니다.
2.11.4. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사용자 프로비저닝 인프라로 설치된 클러스터에는 설치 프로그램에서 프로비저닝한 인프라가 있는 클러스터와 다른 네트워킹 스택이 있습니다. 이러한 차이로 인해 사용자가 프로비저닝한 인프라가 있는 클러스터에서 자동 로드 밸런서 관리가 지원되지 않습니다. 이러한 클러스터의 경우 컴퓨팅 머신 세트는 작업자
및 인프라
유형 머신만 생성할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다. - vCenter 인스턴스에 가상 머신을 배포하는데 필요한 권한이 있고 지정된 데이터 저장소에 필요한 액세스 권한이 있습니다.
- 클러스터에서 사용자 프로비저닝 인프라를 사용하는 경우 해당 구성에 대한 특정 Machine API 요구 사항을 충족할 수 있습니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
사용자 프로비저닝 인프라가 있는 클러스터에 대한 컴퓨팅 머신 세트를 생성하는 경우 다음 중요한 값을 기록해 두십시오.
vSphere
providerSpec
값의 예apiVersion: machine.openshift.io/v1beta1 kind: MachineSet ... template: ... spec: providerSpec: value: apiVersion: machine.openshift.io/v1beta1 credentialsSecret: name: vsphere-cloud-credentials 1 diskGiB: 120 kind: VSphereMachineProviderSpec memoryMiB: 16384 network: devices: - networkName: "<vm_network_name>" numCPUs: 4 numCoresPerSocket: 4 snapshot: "" template: <vm_template_name> 2 userDataSecret: name: worker-user-data 3 workspace: datacenter: <vcenter_datacenter_name> datastore: <vcenter_datastore_name> folder: <vcenter_vm_folder_path> resourcepool: <vsphere_resource_pool> server: <vcenter_server_address> 4
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.11.5. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
2.12. 베어 메탈에 컴퓨팅 머신 세트 생성
베어 메탈의 OpenShift Container Platform 클러스터에서 특정 목적을 충족하기 위해 다른 컴퓨팅 머신 세트를 생성할 수 있습니다. 예를 들어, 지원되는 워크로드를 새 머신으로 이동할 수 있도록 인프라 머신 세트 및 관련 머신을 작성할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
2.12.1. 베어 메탈에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 베어 메탈에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<role>: ""
로 레이블이 지정된 노드를 생성합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 3 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 4 template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machine-role: <role> 6 machine.openshift.io/cluster-api-machine-type: <role> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 8 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/<role>: "" 9 providerSpec: value: apiVersion: baremetal.cluster.k8s.io/v1alpha1 hostSelector: {} image: checksum: http:/172.22.0.3:6181/images/rhcos-<version>.<architecture>.qcow2.<md5sum> 10 url: http://172.22.0.3:6181/images/rhcos-<version>.<architecture>.qcow2 11 kind: BareMetalMachineProviderSpec metadata: creationTimestamp: null userData: name: worker-user-data
- 1 3 5
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 4 8
- 인프라 ID 및 노드 레이블을 지정합니다.
- 6 7 9
- 추가할 노드 레이블을 지정합니다.
- 10
- API VIP 주소를 사용하도록
checksum
URL을 편집합니다. - 11
- API VIP 주소를 사용하도록
url
URL을 편집합니다.
2.12.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
2.12.3. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
추가 리소스
3장. 컴퓨팅 머신 세트 수동 스케일링
컴퓨팅 머신 세트에서 머신 인스턴스를 추가하거나 제거할 수 있습니다.
스케일링 이외의 컴퓨팅 머신 세트의 측면을 변경해야하는 경우 컴퓨팅 머신 세트 수정을 참조하십시오.
3.1. 사전 요구 사항
-
클러스터 전체 프록시를 활성화하고 설치 구성에서
networking.machineNetwork[].cidr
에 포함되지 않은 컴퓨팅 머신을 확장한 경우 연결 문제를 방지하기 위해 프록시 오브젝트의noProxy
필드에 컴퓨팅 머신을 추가해야 합니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
3.2. 컴퓨팅 머신 세트 수동 스케일링
컴퓨팅 머신 세트에서 머신 인스턴스를 추가하거나 제거하려면 컴퓨팅 머신 세트를 수동으로 스케일링할 수 있습니다.
이는 완전히 자동화된 설치 프로그램에 의해 프로비저닝된 인프라 설치와 관련이 있습니다. 사용자 지정 사용자 프로비저닝 인프라 설치에는 컴퓨팅 머신 세트가 없습니다.
사전 요구 사항
-
OpenShift Container Platform 클러스터 및
oc
명령행을 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
다음 명령을 실행하여 클러스터에 있는 컴퓨팅 머신 세트를 확인합니다.
$ oc get machinesets -n openshift-machine-api
컴퓨팅 머신 세트는 <
clusterid>-worker-<aws-region-az> 형식으로 나열됩니다
.다음 명령을 실행하여 클러스터에 있는 컴퓨팅 시스템을 확인합니다.
$ oc get machine -n openshift-machine-api
다음 명령을 실행하여 삭제할 컴퓨팅 머신에 주석을 설정합니다.
$ oc annotate machine/<machine_name> -n openshift-machine-api machine.openshift.io/delete-machine="true"
다음 명령 중 하나를 실행하여 컴퓨팅 머신 세트를 확장합니다.
$ oc scale --replicas=2 machineset <machineset> -n openshift-machine-api
또는 다음을 수행합니다.
$ oc edit machineset <machineset> -n openshift-machine-api
작은 정보다음 YAML을 적용하여 컴퓨팅 머신 세트를 확장할 수 있습니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: <machineset> namespace: openshift-machine-api spec: replicas: 2
컴퓨팅 머신 세트를 확장 또는 축소할 수 있습니다. 새 머신을 사용할 수 있을 때 까지 몇 분 정도 소요됩니다.
중요기본적으로 머신 컨트롤러는 성공할 때까지 머신이 지원하는 노드를 드레이닝하려고 합니다. Pod 중단 예산을 잘못 구성하는 등 일부 상황에서는 드레이닝 작업이 성공하지 못할 수 있습니다. 드레이닝 작업이 실패하면 머신 컨트롤러에서 머신 제거를 진행할 수 없습니다.
특정 머신에서
machine.openshift.io/exclude-node-draining
에 주석을 달아 노드 드레이닝을 건너뛸 수 있습니다.
검증
다음 명령을 실행하여 의도한 시스템의 삭제를 확인합니다.
$ oc get machines
3.3. 컴퓨팅 머신 세트 삭제 정책
Random
, Newest
및 Oldest
의 세 가지 삭제 옵션이 지원됩니다. 기본값은 Random
입니다. 따라서 컴퓨팅 머신 세트를 축소할 때 임의의 머신이 선택되어 삭제됩니다. 특정 컴퓨팅 머신 세트를 수정하여 유스 케이스에 따라 삭제 정책을 설정할 수 있습니다.
spec: deletePolicy: <delete_policy> replicas: <desired_replica_count>
삭제 정책에 관계없이 관련 머신에 machine.openshift.io/delete-machine=true
주석을 추가하여 특정 머신의 삭제 우선 순위를 지정할 수도 있습니다.
기본적으로 OpenShift Container Platform 라우터 Pod는 작업자에게 배포됩니다. 라우터는 웹 콘솔을 포함한 일부 클러스터 리소스에 액세스해야 하므로 먼저 라우터 Pod를 재배치하지 않는 한 작업자 컴퓨팅 머신 세트를 0
으로 스케일링하지 마십시오.
사용자 정의 컴퓨팅 머신 세트는 특정 노드에서 서비스가 실행되고 작업자 컴퓨팅 머신 세트가 축소될 때 컨트롤러에서 해당 서비스를 무시해야 하는 유스 케이스에 사용할 수 있습니다. 이로 인해 서비스 중단을 피할 수 있습니다.
3.4. 추가 리소스
4장. 컴퓨팅 머신 세트 수정
레이블 추가, 인스턴스 유형 변경 또는 블록 스토리지 변경과 같은 컴퓨팅 머신 세트를 수정할 수 있습니다.
RHV(Red Hat Virtualization)에서 컴퓨팅 머신 세트를 변경하여 다른 스토리지 도메인에 새 노드를 프로비저닝할 수도 있습니다.
다른 변경없이 컴퓨팅 머신 세트를 확장해야하는 경우 컴퓨팅 머신 세트 수동 스케일링을 참조하십시오.
4.1. CLI를 사용하여 컴퓨팅 머신 세트 수정
컴퓨팅 머신 세트의 구성을 수정한 다음 CLI를 사용하여 변경 사항을 클러스터의 머신에 전파할 수 있습니다.
컴퓨팅 머신 세트 구성을 업데이트하면 기능을 활성화하거나 생성하는 시스템의 속성을 변경할 수 있습니다. 컴퓨팅 머신 세트를 수정할 때 변경 사항은 업데이트된 MachineSet
CR(사용자 정의 리소스)을 저장한 후 생성된 컴퓨팅 머신에만 적용됩니다. 변경 사항은 기존 머신에는 영향을 미치지 않습니다.
기본 클라우드 공급자의 변경 사항은 Machine
또는 MachineSet
CR에 반영되지 않습니다. 클러스터 관리 인프라에서 인스턴스 구성을 조정하려면 클러스터 측 리소스를 사용합니다.
컴퓨팅 머신 세트를 스케일링하여 복제본 수를 두 배로 만든 다음 원래 복제본 수로 축소하여 업데이트된 구성을 반영하는 기존 머신을 새 시스템으로 교체할 수 있습니다.
다른 변경을 수행하지 않고 컴퓨팅 머신 세트를 확장해야하는 경우 머신을 삭제할 필요가 없습니다.
기본적으로 OpenShift Container Platform 라우터 Pod는 컴퓨팅 머신에 배포됩니다. 라우터는 웹 콘솔을 포함한 일부 클러스터 리소스에 액세스해야 하므로 먼저 라우터 Pod를 재배치하지 않는 한 컴퓨팅 머신 세트를 0
으로 스케일링하지 마십시오.
사전 요구 사항
- OpenShift Container Platform 클러스터는 Machine API를 사용합니다.
-
OpenShift CLI(
oc
)를 사용하여 관리자로 클러스터에 로그인했습니다.
절차
다음 명령을 실행하여 클러스터의 컴퓨팅 머신 세트를 나열합니다.
$ oc get machinesets.machine.openshift.io -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE <compute_machine_set_name_1> 1 1 1 1 55m <compute_machine_set_name_2> 1 1 1 1 55m
다음 명령을 실행하여 컴퓨팅 머신 세트를 편집합니다.
$ oc edit machinesets.machine.openshift.io <machine_set_name> \ -n openshift-machine-api
변경 사항을 적용하기 위해 머신 세트를 스케일링할 때 필요하므로
spec.replicas
필드의 값을 확인합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: <machine_set_name> namespace: openshift-machine-api spec: replicas: 2 1 # ...
- 1
- 이 절차의 예제에서는
replicas
값이2
인 컴퓨팅 머신 세트를 보여줍니다.
- 원하는 구성 옵션을 사용하여 컴퓨팅 머신 세트 CR을 업데이트하고 변경 사항을 저장합니다.
다음 명령을 실행하여 업데이트된 컴퓨팅 머신 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.machine.openshift.io \ -n openshift-machine-api \ -l machine.openshift.io/cluster-api-machineset=<machine_set_name>
AWS 클러스터의 출력 예
NAME PHASE TYPE REGION ZONE AGE <machine_name_original_1> Running m6i.xlarge us-west-1 us-west-1a 4h <machine_name_original_2> Running m6i.xlarge us-west-1 us-west-1a 4h
업데이트된 컴퓨팅 머신 세트에서 관리하는 각 머신에 대해 다음 명령을 실행하여
삭제
주석을 설정합니다.$ oc annotate machine.machine.openshift.io/<machine_name_original_1> \ -n openshift-machine-api \ machine.openshift.io/delete-machine="true"
다음 명령을 실행하여 컴퓨팅 머신 세트를 복제본 수의 두 배로 스케일링합니다.
$ oc scale --replicas=4 \1 machineset.machine.openshift.io <machine_set_name> \ -n openshift-machine-api
- 1
- 원래 예제 값
2
는4
로 두 배가됩니다.
다음 명령을 실행하여 업데이트된 컴퓨팅 머신 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.machine.openshift.io \ -n openshift-machine-api \ -l machine.openshift.io/cluster-api-machineset=<machine_set_name>
AWS 클러스터의 출력 예
NAME PHASE TYPE REGION ZONE AGE <machine_name_original_1> Running m6i.xlarge us-west-1 us-west-1a 4h <machine_name_original_2> Running m6i.xlarge us-west-1 us-west-1a 4h <machine_name_updated_1> Provisioned m6i.xlarge us-west-1 us-west-1a 55s <machine_name_updated_2> Provisioning m6i.xlarge us-west-1 us-west-1a 55s
새 머신이
Running
단계에 있는 경우 컴퓨팅 머신 세트를 원래 복제본 수로 확장할 수 있습니다.다음 명령을 실행하여 컴퓨팅 머신 세트를 원래 복제본 수로 확장합니다.
$ oc scale --replicas=2 \1 machineset.machine.openshift.io <machine_set_name> \ -n openshift-machine-api
- 1
- 원래 예제 값인
2
입니다.
검증
업데이트된 머신 세트로 생성된 머신에 올바른 구성이 있는지 확인하려면 다음 명령을 실행하여 새 머신 중 하나에 대해 CR의 관련 필드를 검사합니다.
$ oc describe machine.machine.openshift.io <machine_name_updated_1> \ -n openshift-machine-api
업데이트된 구성이 없는 컴퓨팅 머신이 삭제되었는지 확인하려면 다음 명령을 실행하여 업데이트된 컴퓨팅 시스템 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.machine.openshift.io \ -n openshift-machine-api \ -l machine.openshift.io/cluster-api-machineset=<machine_set_name>
AWS 클러스터의 삭제가 진행되는 동안 출력 예
NAME PHASE TYPE REGION ZONE AGE <machine_name_original_1> Deleting m6i.xlarge us-west-1 us-west-1a 4h <machine_name_original_2> Deleting m6i.xlarge us-west-1 us-west-1a 4h <machine_name_updated_1> Running m6i.xlarge us-west-1 us-west-1a 5m41s <machine_name_updated_2> Running m6i.xlarge us-west-1 us-west-1a 5m41s
AWS 클러스터의 삭제가 완료된 때의 출력 예
NAME PHASE TYPE REGION ZONE AGE <machine_name_updated_1> Running m6i.xlarge us-west-1 us-west-1a 6m30s <machine_name_updated_2> Running m6i.xlarge us-west-1 us-west-1a 6m30s
추가 리소스
4.2. RHV의 다른 스토리지 도메인으로 노드를 마이그레이션
OpenShift Container Platform 컨트롤 플레인 및 컴퓨팅 노드를 RHV(Red Hat Virtualization) 클러스터에서 다른 스토리지 도메인으로 마이그레이션할 수 있습니다.
4.2.1. RHV에서 다른 스토리지 도메인으로 컴퓨팅 노드 마이그레이션
사전 요구 사항
- Manager에 로그인되어 있습니다.
- 대상 스토리지 도메인의 이름이 있습니다.
절차
다음 명령을 실행하여 가상 머신 템플릿을 확인합니다.
$ oc get -o jsonpath='{.items[0].spec.template.spec.providerSpec.value.template_name}{"\n"}' machineset -A
식별한 템플릿을 기반으로 Manager에 새 가상 머신을 생성합니다. 변경되지 않은 다른 설정은 모두 그대로 둡니다. 자세한 내용은 Red Hat Virtualization 가상 머신 관리 가이드의 템플릿에 따라 가상 머신 생성 을 참조하십시오.
작은 정보새 가상 머신을 시작할 필요가 없습니다.
- 새 가상 머신에서 새 템플릿을 생성합니다. 대상 아래에 대상 스토리지 도메인을 지정합니다. 자세한 내용은 Red Hat Virtualization 가상 머신 관리 가이드에서 템플릿 생성 을 참조하십시오.
새 템플릿을 사용하여 OpenShift Container Platform 클러스터에 새 컴퓨팅 머신 세트를 추가합니다.
다음 명령을 실행하여 현재 컴퓨팅 머신 세트의 세부 정보를 가져옵니다.
$ oc get machineset -o yaml
이러한 세부 정보를 사용하여 컴퓨팅 머신 세트를 생성합니다. 자세한 내용은 컴퓨팅 머신 세트 생성을 참조하십시오.
template_name 필드에 새 가상 머신 템플릿 이름을 입력합니다. Manager의 새 템플릿 대화 상자에서 사용한 것과 동일한 템플릿 이름을 사용합니다.
- 이전 컴퓨팅 머신 세트와 새 컴퓨팅 머신 세트의 이름을 둘 다 기록해 둡니다. 후속 단계에서 참조해야 합니다.
워크로드를 마이그레이션합니다.
새 컴퓨팅 머신 세트를 확장합니다. 컴퓨팅 머신 세트 수동 스케일링에 대한 자세한 내용은 컴퓨팅 머신 세트 수동 확장을 참조하십시오.
OpenShift Container Platform은 이전 머신이 제거되면 Pod를 사용 가능한 작업자로 이동합니다.
- 이전 컴퓨팅 머신 세트를 축소합니다.
다음 명령을 실행하여 이전 컴퓨팅 머신 세트를 제거합니다.
$ oc delete machineset <machineset-name>
4.2.2. RHV의 다른 스토리지 도메인으로 컨트롤 플레인 노드 마이그레이션
OpenShift Container Platform은 컨트롤 플레인 노드를 관리하지 않으므로 컴퓨팅 노드보다 더 쉽게 마이그레이션할 수 있습니다. RHV(Red Hat Virtualization)의 다른 가상 머신과 마찬가지로 마이그레이션할 수 있습니다.
각 노드에 대해 별도로 이 절차를 수행합니다.
사전 요구 사항
- Manager에 로그인되어 있습니다.
- 컨트롤 플레인 노드가 확인되었습니다. 관리자의 마스터 레이블이 지정됩니다.
절차
- master 라는 레이블이 지정된 가상 머신을 선택합니다.
- 가상 머신을 종료합니다.
- 디스크 탭을 클릭합니다.
- 가상 머신의 디스크를 클릭합니다.
-
더 많은 작업
을 클릭하고 이동을 선택합니다.
- 대상 스토리지 도메인을 선택하고 마이그레이션 프로세스가 완료될 때까지 기다립니다.
- 가상 머신을 시작합니다.
OpenShift Container Platform 클러스터가 안정적인지 확인합니다.
$ oc get nodes
출력에
Ready
상태의 노드가 표시되어야 합니다.- 각 컨트롤 플레인 노드에 대해 이 절차를 반복합니다.
5장. 머신 단계 및 라이프사이클
머신은 정의된 여러 단계가 있는 라이프사이클을 통해 이동합니다. 시스템 라이프사이클 및 해당 단계를 이해하면 프로시저가 완료되었는지 또는 원하지 않는 동작의 문제를 해결하는 데 도움이 될 수 있습니다. OpenShift Container Platform에서는 지원되는 모든 클라우드 공급자에서 머신 라이프사이클이 일관되게 유지됩니다.
5.1. 머신 단계
머신이 라이프사이클을 통과할 때 다양한 단계를 거칩니다. 각 단계는 머신 상태에 대한 기본 표현입니다.
프로비저닝
- 새 시스템을 프로비저닝하라는 요청이 있습니다. 시스템은 아직 존재하지 않으며 인스턴스, 공급자 ID 또는 주소가 없습니다.
provisioned
-
시스템이 존재하고 공급자 ID 또는 주소가 있습니다. 클라우드 공급자가 시스템에 대한 인스턴스를 생성했습니다. 시스템이 아직 노드가 되지 않았으며 머신 오브젝트의
status.nodeRef
섹션이 아직 채워지지 않았습니다. Running
-
시스템이 존재하고 공급자 ID 또는 주소가 있습니다. Ignition이 성공적으로 실행되었으며 클러스터 시스템 승인자가 CSR(인증서 서명 요청)을 승인했습니다. 머신이 노드가 되어 머신 오브젝트의
status.nodeRef
섹션에 노드 세부 정보가 포함되어 있습니다. 삭제 중
-
머신을 삭제하라는 요청이 있습니다. 머신 오브젝트에는 삭제 요청 시간을 나타내는
DeletionTimestamp
필드가 있습니다. Failed
- 시스템에 복구할 수 없는 문제가 있습니다. 예를 들어 클라우드 공급자가 머신의 인스턴스를 삭제하는 경우 이러한 상황이 발생할 수 있습니다.
5.2. 머신 라이프사이클
라이프사이클은 시스템 프로비저닝 요청으로 시작하여 시스템이 더 이상 존재하지 않을 때까지 계속됩니다.
머신 라이프사이클은 다음 순서로 진행됩니다. 오류 또는 라이프사이클 후크로 인한 중단은 이 개요에 포함되어 있지 않습니다.
다음 이유 중 하나를 위해 새 시스템을 프로비저닝하라는 요청이 있습니다.
- 클러스터 관리자는 추가 시스템이 필요하므로 머신 세트를 확장합니다.
- 자동 스케일링 정책은 추가 머신이 필요하므로 머신 세트를 스케일링합니다.
- 머신 세트에서 관리하는 머신이 실패하거나 삭제되고 머신 세트는 필요한 수를 유지하기 위해 교체를 생성합니다.
-
시스템이
프로비저닝
단계에 들어갑니다. - 인프라 공급자는 시스템에 대한 인스턴스를 생성합니다.
-
시스템에는 공급자 ID 또는 주소가 있으며
프로비저닝된
단계를 입력합니다. - Ignition 구성 파일이 처리됩니다.
- kubelet은 CSR(인증서 서명 요청)을 발행합니다.
- 클러스터 시스템 승인자가 CSR을 승인합니다.
-
시스템이 노드가 되어
Running
단계로 들어갑니다. 다음과 같은 이유 중 하나로 기존 머신이 삭제될 예정입니다.
-
cluster-admin
권한이 있는 사용자는oc delete machine
명령을 사용합니다. -
머신은
machine.openshift.io/delete-machine
주석을 가져옵니다. - 머신을 관리하는 머신 세트는 복제 수를 조정의 일부로 줄이기 위해 삭제를 위해 표시합니다.
- 클러스터 자동 스케일러는 클러스터의 배포 요구 사항을 충족하는 데 불필요한 노드를 식별합니다.
- 비정상 머신을 교체하도록 머신 상태 점검이 구성되어 있습니다.
-
-
머신은
삭제
로 표시되지만 API에는 여전히 존재합니다. - 머신 컨트롤러는 인프라 공급자에서 인스턴스를 제거합니다.
-
머신 컨트롤러는
Node
오브젝트를 삭제합니다.
5.3. 머신의 단계 확인
OpenShift CLI(oc
)를 사용하거나 웹 콘솔을 사용하여 머신의 단계를 찾을 수 있습니다. 이 정보를 사용하여 프로시저가 완료되었는지 또는 원하지 않는 동작의 문제를 해결할 수 있습니다.
5.3.1. CLI를 사용하여 머신의 단계 확인
OpenShift CLI(oc
)를 사용하여 머신의 단계를 찾을 수 있습니다.
사전 요구 사항
-
cluster-admin
권한이 있는 계정을 사용하여 OpenShift Container Platform 클러스터에 액세스할 수 있습니다. -
oc
CLI를 설치했습니다.
절차
다음 명령을 실행하여 클러스터의 머신을 나열합니다.
$ oc get machine -n openshift-machine-api
출력 예
NAME PHASE TYPE REGION ZONE AGE mycluster-5kbsp-master-0 Running m6i.xlarge us-west-1 us-west-1a 4h55m mycluster-5kbsp-master-1 Running m6i.xlarge us-west-1 us-west-1b 4h55m mycluster-5kbsp-master-2 Running m6i.xlarge us-west-1 us-west-1a 4h55m mycluster-5kbsp-worker-us-west-1a-fmx8t Running m6i.xlarge us-west-1 us-west-1a 4h51m mycluster-5kbsp-worker-us-west-1a-m889l Running m6i.xlarge us-west-1 us-west-1a 4h51m mycluster-5kbsp-worker-us-west-1b-c8qzm Running m6i.xlarge us-west-1 us-west-1b 4h51m
출력의
PHASE
열에는 각 시스템의 단계가 포함됩니다.
5.3.2. 웹 콘솔을 사용하여 머신의 단계 확인
OpenShift Container Platform 웹 콘솔을 사용하여 머신의 단계를 찾을 수 있습니다.
사전 요구 사항
-
cluster-admin
권한이 있는 계정을 사용하여 OpenShift Container Platform 클러스터에 액세스할 수 있습니다.
절차
-
cluster-admin
역할의 사용자로 웹 콘솔에 로그인합니다. - 컴퓨팅 → 머신으로 이동합니다.
- 머신 페이지에서 단계를 찾을 머신의 이름을 선택합니다.
- 머신 세부 정보 페이지에서 YAML 탭을 선택합니다.
YAML 블록에서
status.phase
필드의 값을 찾습니다.YAML 스니펫의 예
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: name: mycluster-5kbsp-worker-us-west-1a-fmx8t # ... status: phase: Running 1
- 1
- 이 예제에서 단계는
실행
중입니다.
5.4. 추가 리소스
6장. 머신 삭제
특정 머신을 삭제할 수 있습니다.
6.1. 특정 머신 삭제
특정 머신을 삭제할 수 있습니다.
클러스터가 컨트롤 플레인 시스템 세트를 사용하지 않는 경우 컨트롤 플레인 시스템을 삭제하지 마십시오.
사전 요구 사항
- OpenShift Container Platform 클러스터를 설치합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
다음 명령을 실행하여 클러스터에 있는 머신을 확인합니다.
$ oc get machine -n openshift-machine-api
명령 출력에는 <
clusterid>-<role>-<cloud_region
> 형식의 머신 목록이 포함되어 있습니다.- 삭제할 머신을 확인합니다.
다음 명령을 실행하여 시스템을 삭제합니다.
$ oc delete machine <machine> -n openshift-machine-api
중요기본적으로 머신 컨트롤러는 성공할 때까지 머신이 지원하는 노드를 드레이닝하려고 합니다. Pod 중단 예산을 잘못 구성하는 등 일부 상황에서는 드레이닝 작업이 성공하지 못할 수 있습니다. 드레이닝 작업이 실패하면 머신 컨트롤러에서 머신 제거를 진행할 수 없습니다.
특정 머신에서
machine.openshift.io/exclude-node-draining
에 주석을 달아 노드 드레이닝을 건너뛸 수 있습니다.삭제한 머신이 머신 세트에 속하는 경우 지정된 복제본 수를 충족하기 위해 새 머신이 즉시 생성됩니다.
6.2. 머신 삭제 단계의 라이프사이클 후크
머신 라이프사이클 후크는 일반 라이프사이클 프로세스가 중단될 수 있는 시스템의 조정 라이프사이클에 있는 지점입니다. 머신 삭제
단계에서 이러한 중단은 구성 요소가 머신 삭제 프로세스를 수정할 수 있는 기회를 제공합니다.
6.2.1. 용어 및 정의
시스템 삭제 단계에 대한 라이프사이클 후크의 동작을 이해하려면 다음 개념을 이해해야 합니다.
- 조정
- 조정은 컨트롤러가 클러스터의 실제 상태 및 오브젝트 사양의 요구 사항과 일치하는 오브젝트를 만드는 프로세스입니다.
- 머신 컨트롤러
머신 컨트롤러는 머신의 조정 라이프사이클을 관리합니다. 클라우드 플랫폼의 머신의 경우 머신 컨트롤러는 OpenShift Container Platform 컨트롤러와 클라우드 공급자의 플랫폼별 작동기 조합입니다.
머신 삭제 컨텍스트에서 머신 컨트롤러는 다음 작업을 수행합니다.
- 머신에서 지원하는 노드를 드레이닝합니다.
- 클라우드 공급자에서 머신 인스턴스를 삭제합니다.
-
Node
오브젝트를 삭제합니다.
- 라이프사이클 후크
라이프사이클 후크는 일반 라이프사이클 프로세스가 중단될 수 있는 오브젝트의 조정 라이프사이클에서 정의된 지점입니다. 구성 요소에서는 라이프사이클 후크를 사용하여 원하는 결과를 얻기 위해 변경 사항을 프로세스에 삽입할 수 있습니다.
머신
삭제
단계에는 다음 두 개의 라이프사이클 후크가 있습니다.-
사전Drain
라이프사이클 후크는 시스템에서 지원하는 노드를 드레인하기 전에 확인해야 합니다. -
인프라 공급자에서 인스턴스를 제거하려면
사전
종료 라이프사이클 후크를 해결해야 합니다.
-
- hook-iECDHE 컨트롤러
후크는 라이프사이클 후크와 상호 작용할 수 있는 머신 컨트롤러가 아닌 컨트롤러입니다. 후크-i>-< 컨트롤러는 다음 작업 중 하나 이상을 수행할 수 있습니다.
- 라이프사이클 후크를 추가합니다.
- 라이프사이클 후크에 응답합니다.
- 라이프사이클 후크를 제거합니다.
각 라이프사이클 후크에는 단일 후크-iECDHE 컨트롤러가 있지만 hook-iECDHE 컨트롤러는 하나 이상의 후크를 관리할 수 있습니다.
6.2.2. 머신 삭제 처리 순서
OpenShift Container Platform 4.13에는 머신 삭제 단계에는 preDrain
및 preTerminate
의 두 가지 라이프사이클 후크가 있습니다. 지정된 라이프사이클 포인트의 모든 후크가 제거되면 정상적으로 조정이 계속됩니다.
그림 6.1. 머신 삭제 흐름

머신 삭제
단계는 다음 순서로 진행됩니다.
다음과 같은 이유 중 하나로 기존 머신이 삭제될 예정입니다.
-
cluster-admin
권한이 있는 사용자는oc delete machine
명령을 사용합니다. -
머신은
machine.openshift.io/delete-machine
주석을 가져옵니다. - 머신을 관리하는 머신 세트는 복제 수를 조정의 일부로 줄이기 위해 삭제를 위해 표시합니다.
- 클러스터 자동 스케일러는 클러스터의 배포 요구 사항을 충족하는 데 불필요한 노드를 식별합니다.
- 비정상 머신을 교체하도록 머신 상태 점검이 구성되어 있습니다.
-
-
머신은
삭제
로 표시되지만 API에는 여전히 존재합니다. preDrain
라이프사이클 후크가 있는 경우 해당 후크를 관리하는 컨트롤러에서 지정된 작업을 수행합니다.모든
사전 라이프사이클 후크
가 충족될 때까지 시스템 상태 조건Drainable
은False
로 설정됩니다.-
해결되지 않은 라이프사이클 후크가 없으며 시스템 상태 조건
Drainable
은True
로 설정됩니다. 머신 컨트롤러에서 머신에서 지원하는 노드를 드레이닝하려고 합니다.
-
드레인링에 실패하면
Drained
가False
로 설정되고 머신 컨트롤러에서 노드를 다시 드레이닝하려고 합니다. -
드레인링에 성공하면
Drained
가True
로 설정됩니다.
-
드레인링에 실패하면
-
Drained
머신 상태 조건은True
로 설정됩니다. preTerminate
라이프사이클 후크가 있는 경우 해당 후크를 관리하는 컨트롤러에서 지정된 작업을 수행합니다.preTerminate
라이프사이클 후크가 모두 충족될 때까지 시스템 상태 조건Terminable
이False
로 설정됩니다.-
확인되지 않은 라이프사이클 후크가 없으며 시스템 상태 조건
Terminable
은True
로 설정됩니다. - 머신 컨트롤러는 인프라 공급자에서 인스턴스를 제거합니다.
-
머신 컨트롤러는
Node
오브젝트를 삭제합니다.
6.2.3. 라이프사이클 후크 구성 삭제
다음 YAML 스니펫에서는 머신 세트 내의 라이프사이클 후크 구성의 형식 및 배치를 보여줍니다.
preDrain
라이프사이클 후크를 보여주는 YAML 스니펫
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: ... spec: lifecycleHooks: preDrain: - name: <hook_name> 1 owner: <hook_owner> 2 ...
사전
종료 라이프사이클 후크를 보여주는 YAML 스니펫
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: ... spec: lifecycleHooks: preTerminate: - name: <hook_name> 1 owner: <hook_owner> 2 ...
라이프사이클 후크 구성 예
다음 예제에서는 시스템 삭제 프로세스를 중단하는 여러 가지 주요 라이프사이클 후크를 구현하는 방법을 보여줍니다.
라이프사이클 후크 구성 예
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: ... spec: lifecycleHooks: preDrain: 1 - name: MigrateImportantApp owner: my-app-migration-controller preTerminate: 2 - name: BackupFileSystem owner: my-backup-controller - name: CloudProviderSpecialCase owner: my-custom-storage-detach-controller 3 - name: WaitForStorageDetach owner: my-custom-storage-detach-controller ...
6.2.4. Operator 개발자의 머신 삭제 라이프사이클 후크 예
Operator는 시스템 삭제 단계에 라이프사이클 후크를 사용하여 시스템 삭제 프로세스를 수정할 수 있습니다. 다음 예제에서는 Operator에서 이 기능을 사용할 수 있는 방법을 보여줍니다.
preDrain
라이프사이클 후크의 사용 사례 예
- 능동적으로 교체 머신
-
Operator는
preDrain
라이프사이클 후크를 사용하여 삭제된 머신의 인스턴스를 제거하기 전에 교체 머신이 성공적으로 생성되고 클러스터에 조인되도록 할 수 있습니다. 이를 통해 머신 교체 또는 즉시 초기화하지 않는 교체 인스턴스의 중단의 영향을 완화할 수 있습니다. - 사용자 정의 드레이닝 논리 구현
Operator는
preDrain
라이프사이클 후크를 사용하여 머신 컨트롤러를 드레이닝 논리를 다른 드레이닝 컨트롤러로 교체할 수 있습니다. 드레이닝 논리를 교체하면 Operator는 각 노드에서 워크로드의 라이프사이클을 보다 유연하게 제어할 수 있었습니다.예를 들어 머신 컨트롤러 드레이닝 라이브러리는 순서를 지원하지 않지만 사용자 정의 드레이닝 공급자가 이 기능을 제공할 수 있습니다. Operator는 사용자 정의 드레인 공급자를 사용하여 클러스터 용량이 제한된 경우 서비스 중단을 최소화하도록 노드를 드레이닝하기 전에 미션 크리티컬 애플리케이션을 이동하는 우선 순위를 지정할 수 있습니다.
사전Terminate
라이프사이클 후크의 사용 사례 예
- 스토리지 분리 확인
-
Operator는
사전 종료 라이프사이클 후크
를 사용하여 머신이 인프라 공급자에서 제거되기 전에 머신에 연결된 스토리지를 분리할 수 있습니다. - 로그 안정성 개선
노드를 드레이닝한 후 로그 내보내기 데몬에서 로그를 중앙 집중식 로깅 시스템에 동기화하는 데 시간이 걸립니다.
로깅 Operator는
preTerminate
라이프사이클 후크를 사용하여 노드 드레이닝 시기와 인프라 공급자에서 머신이 제거된 시점 사이에 지연을 추가할 수 있습니다. 이 지연으로 인해 Operator에서 기본 워크로드가 제거되고 더 이상 로그 백로그에 추가되지 않도록 하는 시간이 제공됩니다. 로그 백로그에 새 데이터가 추가되지 않으면 로그 내보내기에서 동기화 프로세스를 따라 이동하여 모든 애플리케이션 로그를 캡처할 수 있습니다.
6.2.5. 머신 라이프사이클 후크를 통한 쿼럼 보호
Machine API Operator를 사용하는 OpenShift Container Platform 클러스터의 경우 etcd Operator는 머신 삭제 단계에 라이프사이클 후크를 사용하여 쿼럼 보호 메커니즘을 구현합니다.
preDrain
라이프사이클 후크를 사용하면 etcd Operator에서 컨트롤 플레인 시스템의 pod가 드레이닝 및 제거되는 시기를 제어할 수 있습니다. etcd 쿼럼을 보호하기 위해 etcd Operator는 해당 멤버를 클러스터 내의 새 노드로 마이그레이션할 때까지 etcd 멤버를 제거할 수 있습니다.
이 메커니즘을 통해 etcd Operator는 etcd 쿼럼의 멤버를 정확하게 제어할 수 있으며 Machine API Operator는 etcd 클러스터에 대한 특정 운영 지식 없이도 컨트롤 플레인 머신을 안전하게 생성 및 제거할 수 있습니다.
6.2.5.1. 쿼럼 보호 처리 순서를 사용한 컨트롤 플레인 삭제
컨트롤 플레인 머신 세트를 사용하는 클러스터에서 컨트롤 플레인 머신이 교체되면 클러스터에 4개의 컨트롤 플레인 시스템이 일시적으로 부여됩니다. 네 번째 컨트롤 플레인 노드가 클러스터에 참여하면 etcd Operator는 교체 노드에서 새 etcd 멤버를 시작합니다. etcd Operator는 이전 컨트롤 플레인 머신이 삭제로 표시된 것을 관찰하면 이전 노드에서 etcd 멤버를 중지하고 대체 etcd 멤버를 승격하여 클러스터의 쿼럼에 참여하도록 합니다.
컨트롤 플레인 머신 삭제
단계는 다음 순서로 진행됩니다.
- 컨트롤 플레인 시스템이 삭제될 예정입니다.
-
컨트롤 플레인 시스템이
삭제
단계에 들어갑니다. preDrain
라이프사이클 후크를 충족하기 위해 etcd Operator는 다음 작업을 수행합니다.-
etcd Operator는 중단된 컨트롤 플레인 시스템이 etcd 멤버로 클러스터에 추가될 때까지 기다립니다. 이 새 etcd 멤버는
Running
이지만 etcd 리더에서 전체 데이터베이스 업데이트를 수신할 때까지 준비되지
않았습니다. - 새 etcd 멤버가 전체 데이터베이스 업데이트를 수신하면 etcd Operator는 새 etcd 멤버를 투표 멤버로 승격하고 클러스터에서 이전 etcd 멤버를 제거합니다.
이 전환이 완료되면 이전 etcd pod 및 해당 데이터를 제거할 수 있으므로
preDrain
라이프사이클 후크가 제거됩니다.-
etcd Operator는 중단된 컨트롤 플레인 시스템이 etcd 멤버로 클러스터에 추가될 때까지 기다립니다. 이 새 etcd 멤버는
-
컨트롤 플레인 머신 상태 조건
Drainable
은True
로 설정됩니다. 머신 컨트롤러는 컨트롤 플레인 머신에서 지원하는 노드를 드레이닝하려고 합니다.
-
드레인링에 실패하면
Drained
가False
로 설정되고 머신 컨트롤러에서 노드를 다시 드레이닝하려고 합니다. -
드레인링에 성공하면
Drained
가True
로 설정됩니다.
-
드레인링에 실패하면
-
컨트롤 플레인 시스템 상태
조건이
True
로 설정됩니다. -
다른 Operator에
preTerminate
라이프사이클 후크를 추가하지 않은 경우 컨트롤 플레인 머신 상태 조건Terminable
이True
로 설정됩니다. - 머신 컨트롤러는 인프라 공급자에서 인스턴스를 제거합니다.
-
머신 컨트롤러는
Node
오브젝트를 삭제합니다.
etcd 쿼럼 보호 preDrain
라이프사이클 후크를 보여주는 YAML 스니펫
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: ... spec: lifecycleHooks: preDrain: - name: EtcdQuorumOperator 1 owner: clusteroperator/etcd 2 ...
6.3. 추가 리소스
7장. OpenShift Container Platform 클러스터에 자동 스케일링 적용
OpenShift Container Platform 클러스터에 자동 스케일링을 적용하려면클러스터 자동 스케일러를 배포한 다음 클러스터의 각 머신 유형에 대해 머신 자동 스케일러를 배포해야 합니다.
Machine API Operator가 작동하는 클러스터에서만 클러스터 자동 스케일러를 구성할 수 있습니다.
7.1. 클러스터 자동 스케일러 정보
클러스터 자동 스케일러는 현재 배포 요구 사항에 따라 OpenShift Container Platform 클러스터의 크기를 조정합니다. 이는 Kubernetes 형식의 선언적 인수를 사용하여 특정 클라우드 공급자의 개체에 의존하지 않는 인프라 관리를 제공합니다. 클러스터 자동 스케일러에는 클러스터 범위가 있으며 특정 네임 스페이스와 연결되어 있지 않습니다.
리소스가 부족하여 현재 작업자 노드에서 Pod를 예약할 수 없거나 배포 요구를 충족시키기 위해 다른 노드가 필요한 경우 클러스터 자동 스케일러는 클러스터 크기를 늘립니다. 클러스터 자동 스케일러는 사용자가 지정한 제한을 초과하여 클러스터 리소스를 늘리지 않습니다.
클러스터 자동 스케일러는 컨트롤 플레인 노드를 관리하지 않더라도 클러스터에 있는 모든 노드에서 총 메모리, CPU 및 GPU를 계산합니다. 이러한 값은 단일 시스템 지향이 아닙니다. 이는 전체 클러스터에 있는 모든 리소스를 집계한 것입니다. 예를 들어 최대 메모리 리소스 제한을 설정하면 현재 메모리 사용량을 계산할 때 클러스터 자동 스케일러에 클러스터의 모든 노드가 포함됩니다. 그런 다음 클러스터 자동 스케일러에 작업자 리소스를 추가할 수 있는 용량이 있는지 확인하는 데 해당 계산을 사용합니다.
작성한 ClusterAutoscaler
리솟스 정의의 maxNodesTotal
값이 클러스터에서 예상되는 총 머신 수를 대응하기에 충분한 크기의 값인지 확인합니다. 이 값에는 컨트롤 플레인 머신 수 및 확장 가능한 컴퓨팅 머신 수가 포함되어야 합니다.
자동 노드 제거
10초마다 클러스터 자동 스케일러는 클러스터에서 필요하지 않은 노드를 확인하고 제거합니다. 다음 조건이 적용되는 경우 클러스터 자동 스케일러는 노드가 제거를 고려합니다.
-
노드 사용률은 클러스터의 노드 사용률 수준 임계값보다 적습니다. 노드 사용률 수준은 노드에 할당된 리소스로 분할된 요청된 리소스의 합계입니다.
ClusterAutoscaler
사용자 정의 리소스에서 값을 지정하지 않으면 클러스터 자동 스케일러는 50 % 사용률에 해당하는 기본값인0.5
를 사용합니다. - 클러스터 자동 스케일러는 노드에서 실행 중인 모든 Pod를 다른 노드로 이동할 수 있습니다. Kubernetes 스케줄러는 노드에서 Pod를 예약하는 역할을 합니다.
- 클러스터 자동 스케일러에는 축소 비활성화 주석이 없습니다.
노드에 다음 유형의 pod가 있는 경우 클러스터 자동 스케일러는 해당 노드를 제거하지 않습니다.
- 제한적인 PDB (Pod Disruption Budgets)가 있는 pod
- 기본적으로 노드에서 실행되지 않는 Kube 시스템 pod
- PDB가 없거나 제한적인 PDB가있는 Kube 시스템 pod
- deployment, replica set 또는 stateful set와 같은 컨트롤러 객체가 지원하지 않는 pod
- 로컬 스토리지가 있는 pod
- 리소스 부족, 호환되지 않는 노드 선택기 또는 어피니티(affinity), 안티-어피니티(anti-affinity) 일치 등으로 인해 다른 위치로 이동할 수 없는 pod
-
"cluster-autoscaler.kubernetes.io/safe-to-evict": "true"
주석이없는 경우"cluster-autoscaler.kubernetes.io/safe-to-evict": "false"
주석이 있는 pod
예를 들어 최대 CPU 제한을 64코어로 설정하고 각각 8개의 코어가 있는 머신만 생성하도록 클러스터 자동 스케일러를 구성합니다. 클러스터가 30코어로 시작되면 클러스터 자동 스케일러는 총 62개에 대해 32개의 코어가 있는 노드를 4개 더 추가할 수 있습니다.
제한
클러스터 자동 스케일러를 구성하면 추가 사용 제한이 적용됩니다.
- 자동 스케일링된 노드 그룹에 있는 노드를 직접 변경하지 마십시오. 동일한 노드 그룹 내의 모든 노드는 동일한 용량 및 레이블을 가지며 동일한 시스템 pod를 실행합니다.
- pod 요청을 지정합니다.
- pod가 너무 빨리 삭제되지 않도록 해야 하는 경우 적절한 PDB를 구성합니다.
- 클라우드 제공자 할당량이 구성하는 최대 노드 풀을 지원할 수 있는 충분한 크기인지를 확인합니다.
- 추가 노드 그룹 Autoscaler, 특히 클라우드 제공자가 제공하는 Autoscaler를 실행하지 마십시오.
클러스터 자동 스케일러는 예약 가능한 Pod가 생성되는 경우에만 자동 스케일링된 노드 그룹에 노드를 추가합니다. 사용 가능한 노드 유형이 Pod 요청에 대한 요구 사항을 충족할 수 없거나 이러한 요구 사항을 충족할 수 있는 노드 그룹이 최대 크기에 있는 경우 클러스터 자동 스케일러를 확장할 수 없습니다.
다른 스케줄링 기능과의 상호 작용
HPA (Horizond Pod Autoscaler) 및 클러스터 자동 스케일러는 다른 방식으로 클러스터 리소스를 변경합니다. HPA는 현재 CPU 로드를 기준으로 배포 또는 복제 세트의 복제 수를 변경합니다. 로드가 증가하면 HPA는 클러스터에 사용 가능한 리소스 양에 관계없이 새 복제본을 만듭니다. 리소스가 충분하지 않은 경우 클러스터 자동 스케일러는 리소스를 추가하고 HPA가 생성한 pod를 실행할 수 있도록 합니다. 로드가 감소하면 HPA는 일부 복제를 중지합니다. 이 동작으로 일부 노드가 충분히 활용되지 않거나 완전히 비어 있을 경우 클러스터 자동 스케일러가 불필요한 노드를 삭제합니다.
클러스터 자동 스케일러는 pod 우선 순위를 고려합니다. Pod 우선 순위 및 선점 기능을 사용하면 클러스터에 충분한 리소스가 없는 경우 우선 순위에 따라 pod를 예약할 수 있지만 클러스터 자동 스케일러는 클러스터에 모든 pod를 실행하는 데 필요한 리소스가 있는지 확인합니다. 두 기능을 충족하기 위해 클러스터 자동 스케일러에는 우선 순위 컷오프 기능이 포함되어 있습니다. 이 컷오프 기능을 사용하여 "best-effort" pod를 예약하면 클러스터 자동 스케일러가 리소스를 늘리지 않고 사용 가능한 예비 리소스가 있을 때만 실행됩니다.
컷오프 값보다 우선 순위가 낮은 pod는 클러스터가 확장되지 않거나 클러스터가 축소되지 않도록합니다. pod를 실행하기 위해 추가된 새 노드가 없으며 이러한 pod를 실행하는 노드는 리소스를 확보하기 위해 삭제될 수 있습니다.
7.2. 클러스터 자동 스케일러 구성
먼저 클러스터 자동 스케일러를 배포하여 OpenShift Container Platform 클러스터에서 리소스의 자동 스케일링을 관리합니다.
클러스터 자동 스케일러의 범위는 전체 클러스터에 설정되므로 클러스터에 대해 하나의 클러스터 자동 스케일러만 만들 수 있습니다.
7.2.1. 클러스터 자동 스케일러 리소스 정의
이 ClusterAutoscaler
리소스 정의는 클러스터 자동 스케일러의 매개 변수 및 샘플 값을 표시합니다.
기존 클러스터 자동 스케일러의 구성을 변경하면 다시 시작됩니다.
apiVersion: "autoscaling.openshift.io/v1" kind: "ClusterAutoscaler" metadata: name: "default" spec: podPriorityThreshold: -10 1 resourceLimits: maxNodesTotal: 24 2 cores: min: 8 3 max: 128 4 memory: min: 4 5 max: 256 6 gpus: - type: <gpu_type> 7 min: 0 8 max: 16 9 logVerbosity: 4 10 scaleDown: 11 enabled: true 12 delayAfterAdd: 10m 13 delayAfterDelete: 5m 14 delayAfterFailure: 30s 15 unneededTime: 5m 16 utilizationThreshold: "0.4" 17
- 1
- 클러스터 자동 스케일러가 추가 노드를 배포하도록 하려면 pod가 초과해야하는 우선 순위를 지정합니다. 32 비트 정수 값을 입력합니다.
podPriorityThreshold
값은 각 pod에 할당한PriorityClass
의 값과 비교됩니다. - 2
- 배포할 최대 노드 수를 지정합니다. 이 값은 Autoscaler가 제어하는 머신뿐 만 아니라 클러스터에 배치 된 총 머신 수입니다. 이 값이 모든 컨트롤 플레인 및 컴퓨팅 머신과
MachineAutoscaler
리소스에 지정한 총 복제본 수에 대응할 수 있을 만큼 충분한 크기의 값인지 확인합니다. - 3
- 클러스터에 배포할 최소 코어 수를 지정합니다.
- 4
- 클러스터에 배포할 최대 코어 수를 지정합니다.
- 5
- 클러스터에서 최소 메모리 크기를 GiB 단위로 지정합니다.
- 6
- 클러스터에서 최대 메모리 크기를 GiB단위로 지정합니다.
- 7
- 선택 사항: GPU 사용 노드를 배포하도록 클러스터 자동 스케일러를 구성하려면
유형
값을 지정합니다. 이 값은 해당 유형의 GPU 사용 노드를 관리하는 머신 세트의spec.template.spec.metadata.labels[cluster-api/accelerator]
레이블 값과 일치해야 합니다. 예를 들어 이 값은 Nvidia T4 GPU를 나타내는nvidia-t4
이거나 A10G GPU의 경우nvidia-a10g
일 수 있습니다. 자세한 내용은 "클러스터 자동 스케일러의 GPU 머신 세트 레이블"을 참조하십시오. - 8
- 클러스터에 배포할 지정된 유형의 최소 GPU 수를 지정합니다.
- 9
- 클러스터에 배포할 지정된 유형의 최대 GPU 수를 지정합니다.
- 10
- 로깅 세부 정보 표시 수준을
0
에서10
사이로 지정합니다. 지침을 위해 다음과 같은 로그 수준 임계값이 제공됩니다.-
1
: (기본값) 변경 사항에 대한 기본 정보입니다. -
4
: 일반적인 문제 해결을 위한 디버그 수준 상세 정보. -
9
: 광범위한 프로토콜 수준 디버깅 정보
값을 지정하지 않으면 기본값
1
이 사용됩니다. -
- 11
- 12
- 클러스터 자동 스케일러가 불필요한 노드를 제거할 수 있는지 여부를 지정합니다.
- 13
- 선택 사항: 노드가 최근에 추가된 후 노드를 삭제하기 전에 대기할 기간을 지정합니다. 값을 지정하지 않으면 기본값으로
10m
이 사용됩니다. - 14
- 선택 사항: 노드가 최근에 삭제된 후 노드를 삭제하기 전에 대기할 기간을 지정합니다. 값을 지정하지 않으면 기본값
0
이 사용됩니다. - 15
- 선택 사항: 축소 실패 후 노드를 삭제하기 전에 대기할 기간을 지정합니다. 값을 지정하지 않으면 기본값으로
3m
가 사용됩니다. - 16
- 선택 사항: 불필요한 노드를 삭제할 수 있을 때까지 기간을 지정합니다. 값을 지정하지 않으면 기본값으로
10m
이 사용됩니다. - 17
- 선택 사항: 노드 사용률 수준을 지정합니다. 이 사용률 수준의 노드는 삭제할 수 있습니다.
노드 사용률 수준은 요청된 리소스를 노드에 대해 할당된 리소스로 나눈 합계이며
"0"
보다 크지만"1"
미만이어야 합니다. 값을 지정하지 않으면 클러스터 자동 스케일러는 기본값"0.5"
를 사용하며 이는 사용률 50%에 해당합니다. 이 값을 문자열로 표현해야 합니다.
스케일링 작업을 수행할 때 클러스터 자동 스케일러는 클러스터에서 배포할 최소 및 최대 코어 수 또는 메모리 양과 같은 ClusterAutoscaler
리소스 정의에 설정된 범위 내에 유지됩니다. 그러나 클러스터 자동 스케일러는 해당 범위 내에 있는 클러스터의 현재 값을 수정하지 않습니다.
클러스터 자동 스케일러가 노드를 관리하지 않더라도 최소 및 최대 CPU, 메모리 및 GPU 값은 클러스터의 모든 노드에서 해당 리소스를 계산하여 결정됩니다. 예를 들어 클러스터 자동 스케일러가 컨트롤 플레인 노드를 관리하지 않더라도 컨트롤 플레인 노드는 클러스터의 총 메모리에서 고려됩니다.
7.2.1.1. 클러스터 자동 스케일러의 GPU 머신 세트 레이블 지정
머신 세트 레이블을 사용하여 클러스터 자동 스케일러가 GPU 지원 노드를 배포하는 데 사용할 수 있는 시스템을 표시할 수 있습니다.
사전 요구 사항
- 클러스터는 클러스터 자동 스케일러를 사용합니다.
절차
GPU 사용 노드를 배포하는 데 사용할 클러스터 자동 스케일러 시스템을 생성할 머신 세트에서
cluster-api/accelerator
레이블을 추가합니다.apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: name: machine-set-name spec: template: spec: metadata: labels: cluster-api/accelerator: nvidia-t4 1
- 1
- 영숫자 문자
-
,_
또는.
로 구성되며 영숫자 문자로 시작하고 끝나는 레이블을 지정합니다. 예를 들어nvidia-t4
를 사용하여 Nvidia T4 GPU를 표시하거나 A10G GPU의 경우nvidia-a10g
를 사용할 수 있습니다.참고ClusterAutoscaler
CR의spec.resourceLimits.gpus.type
매개변수에 대해 이 레이블의 값을 지정해야 합니다. 자세한 내용은 "클러스터 자동 스케일러 리소스 정의"를 참조하십시오.
7.2.2. 클러스터 자동 스케일러 배포
클러스터 자동 스케일러를 배포하려면 ClusterAutoscaler
리소스의 인스턴스를 만듭니다.
절차
-
사용자 지정 리소스 정의가 포함된
ClusterAutoscaler
리소스에 대한 YAML 파일을 만듭니다. 다음 명령을 실행하여 클러스터에 사용자 지정 리소스를 생성합니다.
$ oc create -f <filename>.yaml 1
- 1
<filename
>은 사용자 정의 리소스 파일의 이름입니다.
다음 단계
- 클러스터 자동 스케일러를 구성한 후 하나 이상의 머신 자동 스케일러를 구성해야 합니다.
7.3. 머신 자동 스케일러 정보
머신 자동 스케일러는 OpenShift Container Platform 클러스터에 배포하는 컴퓨팅 머신 세트의 머신 수를 조정합니다. 기본 작업자
컴퓨팅 머신 세트와 사용자가 생성한 다른 컴퓨팅 머신 세트를 모두 확장할 수 있습니다. 머신 자동 스케일러는 클러스터에 더 많은 배포를 지원하기에 충분한 리소스가 없으면 Machine을 추가합니다. 최소 또는 최대 인스턴스 수와 같은 MachineAutoscaler
리소스의 값에 대한 모든 변경 사항은 대상 컴퓨팅 머신 세트에 즉시 적용됩니다.
머신을 확장하려면 클러스터 자동 스케일러의 머신 자동 스케일러를 배포해야합니다. 클러스터 자동 스케일러는 머신 자동 스케일러가 설정한 컴퓨팅 머신 세트의 주석을 사용하여 확장할 수 있는 리소스를 결정합니다. 머신 자동 스케일러도 정의하지 않고 클러스터 자동 스케일러를 정의하면 클러스터 자동 스케일러는 클러스터를 확장하지 않습니다.
7.4. 머신 자동 스케일러 구성
클러스터 자동 스케일러를 배포한 후 클러스터를 확장하는 데 사용되는 컴퓨팅 머신 세트를 참조하는 MachineAutoscaler
리소스를 배포합니다.
ClusterAutoscaler
리소스를 배포 한 후 하나 이상의 MachineAutoscaler
리소스를 배포해야합니다.
각 컴퓨팅 머신 세트에 대해 별도의 리소스를 구성해야 합니다. 컴퓨팅 머신 세트는 리전마다 다르므로 여러 지역에서 머신 스케일링을 활성화할지 여부를 고려하십시오. 스케일링하는 컴퓨팅 머신 세트에는 하나 이상의 머신이 있어야합니다.
7.4.1. 머신 자동 스케일러 리소스 정의
이 MachineAutoscaler
리소스 정의는 머신 자동 스케일러의 매개 변수 및 샘플 값을 표시합니다.
apiVersion: "autoscaling.openshift.io/v1beta1" kind: "MachineAutoscaler" metadata: name: "worker-us-east-1a" 1 namespace: "openshift-machine-api" spec: minReplicas: 1 2 maxReplicas: 12 3 scaleTargetRef: 4 apiVersion: machine.openshift.io/v1beta1 kind: MachineSet 5 name: worker-us-east-1a 6
- 1
- 머신 자동 스케일러 이름을 지정합니다. 이 머신 자동 스케일러가 스케일링하는 컴퓨팅 머신 세트를 보다 쉽게 식별할 수 있도록 스케일링할 컴퓨팅 머신 세트의 이름을 지정하거나 포함합니다. 컴퓨팅 머신 세트 이름의 형식은 <
clusterid>-<machineset>-<region
>입니다. - 2
- 클러스터 자동 스케일러가 클러스터 스케일링을 시작한 후 지정된 영역에 남아 있어야하는 지정된 유형의 최소 머신 수를 지정하십시오. AWS, GCP, Azure, RHOSP, vSphere에서 실행중인 경우 이 값을
0
으로 설정할 수 있습니다. 다른 공급 업체의 경우 이 값을0
으로 설정하지 마십시오.특수 워크로드에 사용되는 비용이 많이 드는 하드웨어 또는 대규모 머신으로 컴퓨팅 머신 세트를 확장하는 등의 사용 사례에 이 값을
0
으로 설정하여 비용을 절감할 수 있습니다. 머신을 사용하지 않는 경우 클러스터 자동 스케일러는 컴퓨팅 머신 세트를 0으로 축소합니다.중요설치 관리자 프로비저닝 인프라의 OpenShift Container Platform 설치 프로세스 중에 생성된 세 개의 컴퓨팅 머신 세트의
spec.minReplicas
값을0
으로 설정하지 마십시오. - 3
- 클러스터 자동 스케일러가 클러스터 스케일링을 시작한 후 지정된 영역에 배포할 수 있는 지정된 유형의 최대 머신 수를 지정합니다.
ClusterAutoscaler
리소스 정의에서maxNodesTotal
값이 머신 자동 스케일러가 머신 수를 배포할 수 있는 충분한 크기의 값임을 확인합니다. - 4
- 이 섹션에서는 스케일링할 기존 컴퓨팅 머신 세트를 설명하는 값을 지정합니다.
- 5
kind
매개 변수 값은 항상MachineSet
입니다.- 6
metadata.
매개변수 값에 표시된 것처럼 name 값은 기존 컴퓨팅 머신 세트의 이름과 일치해야 합니다.name
7.4.2. 머신 자동 스케일러 배포
머신 자동 스케일러를 배포하려면 MachineAutoscaler
리소스의 인스턴스를 만듭니다.
절차
-
사용자 지정 리소스 정의가 포함된
MachineAutoscaler
리소스에 대한 YAML 파일을 생성합니다. 다음 명령을 실행하여 클러스터에 사용자 지정 리소스를 생성합니다.
$ oc create -f <filename>.yaml 1
- 1
<filename
>은 사용자 정의 리소스 파일의 이름입니다.
7.5. 자동 스케일링 비활성화
클러스터에서 개별 머신 자동 스케일러를 비활성화하거나 클러스터에서 자동 스케일링을 완전히 비활성화할 수 있습니다.
7.5.1. 머신 자동 스케일러 비활성화
머신 자동 스케일러를 비활성화하려면 해당 MachineAutoscaler
CR(사용자 정의 리소스)을 삭제합니다.
머신 자동 스케일러를 비활성화해도 클러스터 자동 스케일러가 비활성화되지 않습니다. 클러스터 자동 스케일러를 비활성화하려면 "클러스터 자동 스케일러 비활성화"의 지침을 따르십시오.
절차
다음 명령을 실행하여 클러스터의
MachineAutoscaler
CR을 나열합니다.$ oc get MachineAutoscaler -n openshift-machine-api
출력 예
NAME REF KIND REF NAME MIN MAX AGE compute-us-east-1a MachineSet compute-us-east-1a 1 12 39m compute-us-west-1a MachineSet compute-us-west-1a 2 4 37m
선택 사항: 다음 명령을 실행하여
MachineAutoscaler
CR의 YAML 파일 백업을 생성합니다.$ oc get MachineAutoscaler/<machine_autoscaler_name> \1 -n openshift-machine-api \ -o yaml> <machine_autoscaler_name_backup>.yaml 2
다음 명령을 실행하여
MachineAutoscaler
CR을 삭제합니다.$ oc delete MachineAutoscaler/<machine_autoscaler_name> -n openshift-machine-api
출력 예
machineautoscaler.autoscaling.openshift.io "compute-us-east-1a" deleted
검증
머신 자동 스케일러가 비활성화되어 있는지 확인하려면 다음 명령을 실행합니다.
$ oc get MachineAutoscaler -n openshift-machine-api
비활성화된 머신 자동 스케일러가 머신 자동 스케일러 목록에 표시되지 않습니다.
다음 단계
-
머신 자동 스케일러를 다시 활성화해야 하는 경우 <
machine_autoscaler_name_backup>.yaml
백업 파일을 사용하고 "머신 자동 스케일러 배포"의 지침을 따르십시오.
추가 리소스
7.5.2. 클러스터 자동 스케일러 비활성화
클러스터 자동 스케일러를 비활성화하려면 해당 ClusterAutoscaler
리소스를 삭제합니다.
클러스터 자동 스케일러를 비활성화하면 클러스터에 기존 머신 자동 스케일러가 있더라도 클러스터에서 자동 스케일링을 비활성화합니다.
절차
다음 명령을 실행하여 클러스터의
ClusterAutoscaler
리소스를 나열합니다.$ oc get ClusterAutoscaler
출력 예
NAME AGE default 42m
선택 사항: 다음 명령을 실행하여
ClusterAutoscaler
CR의 YAML 파일 백업을 만듭니다.$ oc get ClusterAutoscaler/default \1 -o yaml> <cluster_autoscaler_backup_name>.yaml 2
다음 명령을 실행하여
ClusterAutoscaler
CR을 삭제합니다.$ oc delete ClusterAutoscaler/default
출력 예
clusterautoscaler.autoscaling.openshift.io "default" deleted
검증
클러스터 자동 스케일러가 비활성화되어 있는지 확인하려면 다음 명령을 실행합니다.
$ oc get ClusterAutoscaler
예상 출력
No resources found
다음 단계
-
ClusterAutoscaler
CR을 삭제하여 클러스터 자동 스케일러를 비활성화하면 클러스터가 자동 스케일링되지 않지만 클러스터의 기존 머신 자동 스케일러는 삭제되지 않습니다. 불필요한 머신 자동 스케일러를 정리하려면 "시스템 자동 스케일러 비활성화"를 참조하십시오. -
클러스터 자동 스케일러를 다시 활성화해야 하는 경우 <
cluster_autoscaler_name_backup>.yaml
백업 파일을 사용하고 "클러스터 자동 스케일러 배포"의 지침을 따르십시오.
추가 리소스
7.6. 추가 리소스
8장. 인프라 머신 세트 생성
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
인프라 머신 세트를 사용하여 기본 라우터, 통합 컨테이너 이미지 레지스트리, 클러스터 지표 및 모니터링 구성 요소와 같은 인프라 구성 요소만 호스팅하는 머신을 생성할 수 있습니다. 이러한 인프라 시스템은 환경을 실행하는 데 필요한 총 서브스크립션 수에 포함되지 않습니다.
프로덕션 배포에서는 인프라 구성 요소를 유지하기 위해 세 개 이상의 머신 세트를 배포하는 것이 좋습니다. Red Hat OpenShift Service Mesh는 Elasticsearch를 배포합니다. 이 Elasticsearch는 다른 노드에 3개의 인스턴스를 설치해야 합니다. 이러한 각 노드는 고가용성을 위해 다른 가용성 영역에 배포할 수 있습니다. 이 구성에는 가용성 영역마다 하나씩 3개의 서로 다른 머신 세트가 필요합니다. 여러 가용성 영역이 없는 글로벌 Azure 리전에서는 가용성 세트를 사용하여 고가용성을 보장할 수 있습니다.
8.1. OpenShift Container Platform 인프라 구성 요소
각 자체 관리형 Red Hat OpenShift 서브스크립션에는 OpenShift Container Platform 및 기타 OpenShift 관련 구성 요소에 대한 권한이 포함되어 있습니다. 이러한 권한은 OpenShift Container Platform 컨트롤 플레인 및 인프라 워크로드를 실행하는 데 포함되며 크기 조정 중에 고려하지 않아도 됩니다.
인프라 노드로 자격을 부여하고 포함된 인타이틀먼트를 사용하려면 최종 사용자 애플리케이션의 일부가 아닌 클러스터를 지원하는 구성 요소만 해당 인스턴스에서 실행할 수 있습니다. 예를 들면 다음과 같은 구성 요소가 있습니다.
- Kubernetes 및 OpenShift Container Platform 컨트롤 플레인 서비스
- 기본 라우터
- 통합된 컨테이너 이미지 레지스트리
- HAProxy 기반 Ingress 컨트롤러
- 사용자 정의 프로젝트를 모니터링하기위한 구성 요소를 포함한 클러스터 메트릭 수집 또는 모니터링 서비스
- 클러스터 집계 로깅
- Red Hat Quay
- Red Hat OpenShift Data Foundation
- Red Hat Advanced Cluster Security for Kubernetes
- Red Hat Advanced Cluster Security for Kubernetes
- Red Hat OpenShift GitOps
- Red Hat OpenShift Pipelines
- Red Hat OpenShift Service Mesh
다른 컨테이너, Pod 또는 구성 요소를 실행하는 모든 노드는 서브스크립션을 적용해야 하는 작업자 노드입니다.
인프라 노드 및 인프라 노드에서 실행할 수 있는 구성 요소에 대한 자세한 내용은 엔터프라이즈 Kubernetes용 OpenShift 크기 조정 및 서브스크립션 가이드의 "Red Hat OpenShift 컨트롤 플레인 및 인프라 노드" 섹션을 참조하십시오.
인프라 노드를 생성하려면 머신 세트를 사용하거나노드에 레이블을 지정하거나 머신 구성 풀을 사용할 수 있습니다.
8.2. 프로덕션 환경의 인프라 머신 세트 생성
프로덕션 배포에서는 인프라 구성 요소를 유지하기 위해 세 개 이상의 컴퓨팅 머신 세트를 배포하는 것이 좋습니다. Red Hat OpenShift Service Mesh는 Elasticsearch를 배포합니다. 이 Elasticsearch는 다른 노드에 3개의 인스턴스를 설치해야 합니다. 이러한 각 노드는 고가용성을 위해 다른 가용성 영역에 배포할 수 있습니다. 이와 같은 구성에는 각 가용성 영역마다 하나씩 3개의 컴퓨팅 시스템 세트가 필요합니다. 여러 가용성 영역이 없는 글로벌 Azure 리전에서는 가용성 세트를 사용하여 고가용성을 보장할 수 있습니다.
8.2.1. 다른 클라우드의 인프라 머신 세트 생성
클라우드에 샘플 컴퓨팅 머신 세트를 사용합니다.
8.2.1.1. ECDHE Cloud에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 지정된ECDHE Cloud 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> 3 name: <infrastructure_id>-<infra>-<zone> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<zone> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <infra> 8 machine.openshift.io/cluster-api-machine-type: <infra> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<zone> 10 spec: metadata: labels: node-role.kubernetes.io/infra: "" providerSpec: value: apiVersion: machine.openshift.io/v1 credentialsSecret: name: alibabacloud-credentials imageId: <image_id> 11 instanceType: <instance_type> 12 kind: AlibabaCloudMachineProviderConfig ramRoleName: <infrastructure_id>-role-worker 13 regionId: <region> 14 resourceGroup: 15 id: <resource_group_id> type: ID securityGroups: - tags: 16 - Key: Name Value: <infrastructure_id>-sg-<role> type: Tags systemDisk: 17 category: cloud_essd size: <disk_size> tag: 18 - Key: kubernetes.io/cluster/<infrastructure_id> Value: owned userDataSecret: name: <user_data_secret> 19 vSwitch: tags: 20 - Key: Name Value: <infrastructure_id>-vswitch-<zone> type: Tags vpcId: "" zoneId: <zone> 21 taints: 22 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1 5 7
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9
<infra>
노드 레이블을 지정합니다.- 4 6 10
- 인프라 ID,
<infra>
노드 레이블 및 영역을 지정합니다. - 11
- 사용할 이미지를 지정합니다. 클러스터에 대한 기존 기본 컴퓨팅 시스템 세트의 이미지를 사용합니다.
- 12
- 컴퓨팅 머신 세트에 사용할 인스턴스 유형을 지정합니다.
- 13
- 컴퓨팅 머신 세트에 사용할 RAM 역할의 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.
- 14
- 머신을 배치할 리전을 지정합니다.
- 15
- 클러스터의 리소스 그룹 및 유형을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용하거나 다른 머신을 지정할 수 있습니다.
- 16 18 20
- 컴퓨팅 머신 세트에 사용할 태그를 지정합니다. 최소로 이 예제에 표시된 태그를 클러스터에 적절한 값과 함께 포함해야 합니다. 필요에 따라 설치 프로그램이 생성하는 기본 컴퓨팅 시스템에 채우는 태그를 포함하여 추가 태그를 포함할 수 있습니다.
- 17
- root 디스크의 유형 및 크기를 지정합니다. 설치 프로그램이 생성하는 기본 컴퓨팅 시스템에서 채우는
category
값을 사용합니다. 필요한 경우크기를
위해 다른 값을 기가 바이트로 지정합니다. - 19
openshift-machine-api
네임스페이스에 있는 사용자 데이터 YAML 파일에서 시크릿 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.- 21
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
- 22
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
ECDHE Cloud 사용 통계에 대한 머신 세트 매개변수
설치 프로그램이ECDHE Cloud 클러스터에 대해 생성하는 기본 컴퓨팅 머신 세트에는 사용 통계를 추적하는 데 내부적으로 사용하는 필수 태그 값이 포함되어 있습니다. 이러한 태그는 spec.template.spec.providerSpec.value
목록의 securityGroups
,tag
, vSwitch
매개변수로 채워집니다.
추가 시스템을 배포하기 위해 컴퓨팅 머신 세트를 생성할 때 필요한 Kubernetes 태그를 포함해야 합니다. 사용량 통계 태그는 생성한 컴퓨팅 머신 세트에 지정되지 않은 경우에도 기본적으로 적용됩니다. 필요에 따라 추가 태그를 포함할 수도 있습니다.
다음 YAML 스니펫은 기본 컴퓨팅 머신 세트의 태그는 선택 사항이며 필요한 태그를 나타냅니다.
spec.template.spec.providerSpec.value.securityGroups
의 태그
spec: template: spec: providerSpec: value: securityGroups: - tags: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 2 Value: ocp - Key: Name Value: <infrastructure_id>-sg-<role> 3 type: Tags
spec.template.spec.providerSpec.value.tag
의 태그
spec: template: spec: providerSpec: value: tag: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV 2 Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 3 Value: ocp
spec.template.spec.providerSpec.value.vSwitch
의 태그
spec: template: spec: providerSpec: value: vSwitch: tags: - Key: kubernetes.io/cluster/<infrastructure_id> 1 Value: owned - Key: GISV 2 Value: ocp - Key: sigs.k8s.io/cloud-provider-alibaba/origin 3 Value: ocp - Key: Name Value: <infrastructure_id>-vswitch-<zone> 4 type: Tags
8.2.1.2. AWS에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 us-east-1a
AWS(Amazon Web Services) 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 생성합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-infra-<zone> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 3 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<zone> 4 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machine-role: infra 6 machine.openshift.io/cluster-api-machine-type: infra 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<zone> 8 spec: metadata: labels: node-role.kubernetes.io/infra: "" 9 providerSpec: value: ami: id: ami-046fe691f52a953f9 10 apiVersion: awsproviderconfig.openshift.io/v1beta1 blockDevices: - ebs: iops: 0 volumeSize: 120 volumeType: gp2 credentialsSecret: name: aws-cloud-credentials deviceIndex: 0 iamInstanceProfile: id: <infrastructure_id>-worker-profile 11 instanceType: m6i.large kind: AWSMachineProviderConfig placement: availabilityZone: <zone> 12 region: <region> 13 securityGroups: - filters: - name: tag:Name values: - <infrastructure_id>-worker-sg 14 subnet: filters: - name: tag:Name values: - <infrastructure_id>-private-<zone> 15 tags: - name: kubernetes.io/cluster/<infrastructure_id> 16 value: owned - name: <custom_tag_name> 17 value: <custom_tag_value> 18 userDataSecret: name: worker-user-data taints: 19 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1 3 5 11 14 16
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 4 8
- 인프라 ID, 인프라
역할
노드 레이블 및 영역을 지정합니다. - 6 7 9
infra
역할 노드 레이블을 지정합니다.- 10
- OpenShift Container Platform 노드의 AWS 영역에 유효한 RHCOS(Red Hat Enterprise Linux CoreOS) Amazon 머신 이미지(AMI)를 지정합니다. AWS Marketplace 이미지를 사용하려면 리전의 AMI ID를 얻으려면 AWS Marketplace 에서 OpenShift Container Platform 서브스크립션을 완료해야 합니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.ami.id}{"\n"}' \ get machineset/<infrastructure_id>-<role>-<zone>
- 17 18
- 선택 사항: 클러스터의 사용자 정의 태그 데이터를 지정합니다. 예를 들어 이메일
:admin-email@example.com의
주소를 추가할 수 있습니다.name:value
쌍을 지정하여 관리자 연락처 이메일참고install-config.yml
파일에서 설치 중에 사용자 지정 태그를 지정할 수도 있습니다.install-config.yml
파일과 머신 세트에 동일한이름
데이터가 있는 태그가 포함된 경우 머신 세트의 태그 값이install-config.yml
파일의 태그 값보다 우선합니다. - 12
- 영역을 지정합니다(예:
us-east-1a
). - 13
- 리전을 지정합니다(예:
us-east-1)
. - 15
- 인프라 ID 및 영역을 지정합니다.
- 19
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
AWS에서 실행되는 머신 세트는 보장되지 않는 Spot 인스턴스를 지원합니다. AWS의 온 디맨드 인스턴스에 비해 저렴한 가격으로 Spot 인스턴스를 사용하여 비용을 절약할 수 있습니다. spotMarketOptions
를 MachineSet
YAML 파일에 추가하여 Spot 인스턴스를 구성합니다.
8.2.1.3. Azure에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 1
Microsoft Azure 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 < infrastructure_id
>는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 infra
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: infra 2 machine.openshift.io/cluster-api-machine-type: infra name: <infrastructure_id>-infra-<region> 3 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<region> template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: infra machine.openshift.io/cluster-api-machine-type: infra machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<region> spec: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-machineset: <machineset_name> node-role.kubernetes.io/infra: "" providerSpec: value: apiVersion: azureproviderconfig.openshift.io/v1beta1 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api image: 4 offer: "" publisher: "" resourceID: /resourceGroups/<infrastructure_id>-rg/providers/Microsoft.Compute/galleries/gallery_<infrastructure_id>/images/<infrastructure_id>-gen2/versions/latest 5 sku: "" version: "" internalLoadBalancer: "" kind: AzureMachineProviderSpec location: <region> 6 managedIdentity: <infrastructure_id>-identity metadata: creationTimestamp: null natRule: null networkResourceGroup: "" osDisk: diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: "" resourceGroup: <infrastructure_id>-rg sshPrivateKey: "" sshPublicKey: "" tags: - name: <custom_tag_name> 7 value: <custom_tag_value> subnet: <infrastructure_id>-<role>-subnet userDataSecret: name: worker-user-data vmSize: Standard_D4s_v3 vnet: <infrastructure_id>-vnet zone: "1" 8 taints: 9 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
다음 명령을 실행하여 서브넷을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.subnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
다음 명령을 실행하여 vnet을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.vnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
- 2
infra
노드 레이블을 지정합니다.- 3
- 인프라 ID, 인프라 노드
레이블
및 리전을 지정합니다. - 4
- 컴퓨팅 머신 세트의 이미지 세부 정보를 지정합니다. Azure Marketplace 이미지를 사용하려면 "Azure Marketplace 이미지 선택"을 참조하십시오.
- 5
- 인스턴스 유형과 호환되는 이미지를 지정합니다. 설치 프로그램에 의해 생성된 Hyper-V 생성 V2 이미지에는
-gen2
접미사가 있으며 V1 이미지는 접미사 없이 이름이 동일합니다. - 6
- 머신을 배치할 리전을 지정합니다.
- 7
- 선택 사항: 머신 세트에서 사용자 지정 태그를 지정합니다. 태그 이름을 <
custom_tag_name
> 필드에 제공하고 해당 태그 값을 <custom_tag_value
> 필드에 입력합니다. - 8
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전에서 지정하는 영역을 지원하는지 확인합니다.중요
리전에서 가용성 영역을 지원하는 경우 영역을 지정해야 합니다. 영역을 지정하면 Pod에 영구 볼륨 연결이 필요한 경우 볼륨 노드 유사성 오류가 발생하지 않습니다. 이를 위해 동일한 리전의 각 영역에 대한 컴퓨팅 머신 세트를 생성할 수 있습니다.
- 9
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
Azure에서 실행되는 머신 세트는 보장되지 않는 Spot 가상 머신을 지원합니다. Azure의 표준 가상 머신에 비해 더 낮은 가격으로 Spot 가상 머신을 사용하여 비용을 절감할 수 있습니다. spotVMOptions
를 MachineSet
YAML 파일에 추가하여 Spot 가상 머신을 구성할 수 있습니다.
추가 리소스
8.2.1.4. Azure Stack Hub에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 1
Microsoft Azure 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> 3 name: <infrastructure_id>-infra-<region> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<region> 6 template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <infra> 8 machine.openshift.io/cluster-api-machine-type: <infra> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra-<region> 10 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/infra: "" 11 taints: 12 - key: node-role.kubernetes.io/infra effect: NoSchedule providerSpec: value: apiVersion: machine.openshift.io/v1beta1 availabilitySet: <availability_set> 13 credentialsSecret: name: azure-cloud-credentials namespace: openshift-machine-api image: offer: "" publisher: "" resourceID: /resourceGroups/<infrastructure_id>-rg/providers/Microsoft.Compute/images/<infrastructure_id> 14 sku: "" version: "" internalLoadBalancer: "" kind: AzureMachineProviderSpec location: <region> 15 managedIdentity: <infrastructure_id>-identity 16 metadata: creationTimestamp: null natRule: null networkResourceGroup: "" osDisk: diskSizeGB: 128 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: "" resourceGroup: <infrastructure_id>-rg 17 sshPrivateKey: "" sshPublicKey: "" subnet: <infrastructure_id>-<role>-subnet 18 19 userDataSecret: name: worker-user-data 20 vmSize: Standard_DS4_v2 vnet: <infrastructure_id>-vnet 21 zone: "1" 22
- 1 5 7 14 16 17 18 21
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
다음 명령을 실행하여 서브넷을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.subnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
다음 명령을 실행하여 vnet을 가져올 수 있습니다.
$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.vnet}{"\n"}' \ get machineset/<infrastructure_id>-worker-centralus1
- 2 3 8 9 11 19 20
<infra>
노드 레이블을 지정합니다.- 4 6 10
- 인프라 ID,
<infra>
노드 레이블 및 리전을 지정합니다. - 12
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다. - 15
- 머신을 배치할 리전을 지정합니다.
- 13
- 클러스터의 가용성 세트를 지정합니다.
- 22
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
Azure Stack Hub에서 실행되는 머신 세트는 보장되지 않는 Spot 가상 머신을 지원하지 않습니다.
8.2.1.5. IBM Cloud에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 리전의 지정된 IBM Cloud 영역에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> 3 name: <infrastructure_id>-<infra>-<region> 4 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<region> 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <infra> 8 machine.openshift.io/cluster-api-machine-type: <infra> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<region> 10 spec: metadata: labels: node-role.kubernetes.io/infra: "" providerSpec: value: apiVersion: ibmcloudproviderconfig.openshift.io/v1beta1 credentialsSecret: name: ibmcloud-credentials image: <infrastructure_id>-rhcos 11 kind: IBMCloudMachineProviderSpec primaryNetworkInterface: securityGroups: - <infrastructure_id>-sg-cluster-wide - <infrastructure_id>-sg-openshift-net subnet: <infrastructure_id>-subnet-compute-<zone> 12 profile: <instance_profile> 13 region: <region> 14 resourceGroup: <resource_group> 15 userDataSecret: name: <role>-user-data 16 vpc: <vpc_name> 17 zone: <zone> 18 taints: 19 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1 5 7
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9 16
- <
;infra>
; 노드 레이블입니다. - 4 6 10
- 인프라 ID, <
;infra&
gt; 노드 레이블 및 리전. - 11
- 클러스터 설치에 사용된 사용자 지정 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지입니다.
- 12
- 시스템을 배치할 리전 내 인프라 ID 및 영역입니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
- 13
- IBM Cloud 인스턴스 프로필을 지정합니다.
- 14
- 머신을 배치할 리전을 지정합니다.
- 15
- 시스템 리소스가 배치되는 리소스 그룹입니다. 이는 설치 시 지정된 기존 리소스 그룹 또는 인프라 ID를 기반으로 이름이 지정된 설치 관리자 생성 리소스 그룹입니다.
- 17
- VPC 이름입니다.
- 18
- 머신을 배치할 리전 내 영역을 지정합니다. 해당 리전이 지정한 영역을 지원하는지 확인합니다.
- 19
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 하는 테인트입니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
8.2.1.6. GCP에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 GCP(Google Cloud Platform)에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 생성합니다. 여기서 infra
는 추가할 노드 레이블입니다.
OpenShift CLI를 사용하여 얻은 값
다음 예제에서는 OpenShift CLI를 사용하여 클러스터의 일부 값을 가져올 수 있습니다.
- 인프라 ID
&
lt;infrastructure_id
> 문자열은 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 이미지 경로
&
lt;path_to_image
> 문자열은 디스크를 만드는 데 사용된 이미지의 경로입니다. OpenShift CLI가 설치되어 있으면 다음 명령을 실행하여 이미지에 대한 경로를 얻을 수 있습니다.$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.spec.providerSpec.value.disks[0].image}{"\n"}' \ get machineset/<infrastructure_id>-worker-a
GCP MachineSet
값 샘플
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-w-a namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-w-a template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-w-a spec: metadata: labels: node-role.kubernetes.io/infra: "" providerSpec: value: apiVersion: gcpprovider.openshift.io/v1beta1 canIPForward: false credentialsSecret: name: gcp-cloud-credentials deletionProtection: false disks: - autoDelete: true boot: true image: <path_to_image> 3 labels: null sizeGb: 128 type: pd-ssd gcpMetadata: 4 - key: <custom_metadata_key> value: <custom_metadata_value> kind: GCPMachineProviderSpec machineType: n1-standard-4 metadata: creationTimestamp: null networkInterfaces: - network: <infrastructure_id>-network subnetwork: <infrastructure_id>-worker-subnet projectID: <project_name> 5 region: us-central1 serviceAccounts: 6 - email: <infrastructure_id>-w@<project_name>.iam.gserviceaccount.com scopes: - https://www.googleapis.com/auth/cloud-platform tags: - <infrastructure_id>-worker userDataSecret: name: worker-user-data zone: us-central1-a taints: 7 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1
- &
lt;infrastructure_id
>의 경우 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 인프라 ID를 지정합니다. - 2
- <
;infra>
; 의 경우 <infra>
노드 레이블을 지정합니다. - 3
- 현재 컴퓨팅 머신 세트에서 사용되는 이미지의 경로를 지정합니다.
GCP Marketplace 이미지를 사용하려면 사용할 오퍼를 지정합니다.
-
OpenShift Container Platform:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-ocp-413-x86-64-202305021736
-
OpenShift Platform Plus:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-opp-413-x86-64-202305021736
-
OpenShift Kubernetes Engine:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-oke-413-x86-64-202305021736
-
OpenShift Container Platform:
- 4
- 선택 사항:
키:값
쌍의 형식으로 사용자 지정 메타데이터를 지정합니다. 예를 들어 사용 사례는 사용자 정의 메타데이터 설정에 대한 GCP 설명서를 참조하십시오. - 5
- &
lt;project_name
>에 대해 클러스터에 사용하는 GCP 프로젝트의 이름을 지정합니다. - 6
- 단일 서비스 계정을 지정합니다. 여러 서비스 계정이 지원되지 않습니다.
- 7
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
GCP에서 실행되는 머신 세트는 보장되지 않는 선점 가능한 가상 머신 인스턴스를 지원합니다. GCP의 일반 인스턴스에 비해 더 낮은 가격으로 선점 가능한 가상 머신 인스턴스를 사용하여 비용을 절감할 수 있습니다. preemptible 을 MachineSet
YAML 파일에 preemptible
추가하여 선점 가능한 가상 머신 인스턴스를 구성할 수 있습니다.
8.2.1.7. Nutanix에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 생성하는 Nutanix 컴퓨팅 머신 세트를 정의합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
OpenShift CLI를 사용하여 얻은 값
다음 예제에서는 OpenShift CLI(oc
)를 사용하여 클러스터의 일부 값을 가져올 수 있습니다.
- 인프라 ID
&
lt;infrastructure_id
> 문자열은 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> name: <infrastructure_id>-<infra>-<zone> 3 namespace: openshift-machine-api annotations: 4 machine.openshift.io/memoryMb: "16384" machine.openshift.io/vCPU: "4" spec: replicas: 3 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<zone> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <infra> machine.openshift.io/cluster-api-machine-type: <infra> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<infra>-<zone> spec: metadata: labels: node-role.kubernetes.io/infra: "" providerSpec: value: apiVersion: machine.openshift.io/v1 bootType: "" 5 categories: 6 - key: <category_name> value: <category_value> cluster: 7 type: uuid uuid: <cluster_uuid> credentialsSecret: name: nutanix-credentials image: name: <infrastructure_id>-rhcos 8 type: name kind: NutanixMachineProviderConfig memorySize: 16Gi 9 project: 10 type: name name: <project_name> subnets: - type: uuid uuid: <subnet_uuid> systemDiskSize: 120Gi 11 userDataSecret: name: <user_data_secret> 12 vcpuSockets: 4 13 vcpusPerSocket: 1 14 taints: 15 - key: node-role.kubernetes.io/infra effect: NoSchedule
- 1
- &
lt;infrastructure_id
>의 경우 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 인프라 ID를 지정합니다. - 2
<infra>
노드 레이블을 지정합니다.- 3
- 인프라 ID,
<infra>
노드 레이블 및 영역을 지정합니다. - 4
- 클러스터 자동 스케일러의 주석입니다.
- 5
- 컴퓨팅 시스템에서 사용하는 부팅 유형을 지정합니다. 부팅 유형에 대한 자세한 내용은 가상화 된 환경에서 UEFI, Secure Boot 및 TPM 이해를 참조하십시오. 유효한 값은
레거시
,SecureBoot
또는UEFI
입니다. 기본값은레거시
입니다.참고OpenShift Container Platform 4.13에서
레거시
부팅 유형을 사용해야 합니다. - 6
- 컴퓨팅 머신에 적용할 하나 이상의 Nutanix Prism 카테고리를 지정합니다. 이 스탠자에는 Prism Central에 존재하는 카테고리 키-값 쌍에 대한
key
및value
매개변수가 필요합니다. 카테고리에 대한 자세한 내용은 카테고리 관리를 참조하십시오. - 7
- Nutanix Prism Element 클러스터 구성을 지정합니다. 이 예에서 클러스터 유형은
uuid
이므로uuid
스탠자가 있습니다. - 8
- 사용할 이미지를 지정합니다. 클러스터에 대한 기존 기본 컴퓨팅 시스템 세트의 이미지를 사용합니다.
- 9
- Gi에서 클러스터의 메모리 크기를 지정합니다.
- 10
- 클러스터에 사용하는 Nutanix 프로젝트를 지정합니다. 이 예에서 프로젝트 유형은
name
이므로name
스탠자가 있습니다. - 11
- Gi에서 시스템 디스크의 크기를 지정합니다.
- 12
openshift-machine-api
네임스페이스에 있는 사용자 데이터 YAML 파일에서 시크릿 이름을 지정합니다. 설치 프로그램이 기본 컴퓨팅 시스템 세트에 채우는 값을 사용합니다.- 13
- vCPU 소켓 수를 지정합니다.
- 14
- 소켓당 vCPU 수를 지정합니다.
- 15
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다.
8.2.1.8. RHOSP에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 RHOSP(Red Hat OpenStack Platform)에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <infra> 2 machine.openshift.io/cluster-api-machine-type: <infra> 3 name: <infrastructure_id>-infra 4 namespace: openshift-machine-api spec: replicas: <number_of_replicas> selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra 6 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machine-role: <infra> 8 machine.openshift.io/cluster-api-machine-type: <infra> 9 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra 10 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/infra: "" taints: 11 - key: node-role.kubernetes.io/infra effect: NoSchedule providerSpec: value: apiVersion: openstackproviderconfig.openshift.io/v1alpha1 cloudName: openstack cloudsSecret: name: openstack-cloud-credentials namespace: openshift-machine-api flavor: <nova_flavor> image: <glance_image_name_or_location> serverGroupID: <optional_UUID_of_server_group> 12 kind: OpenstackProviderSpec networks: 13 - filter: {} subnets: - filter: name: <subnet_name> tags: openshiftClusterID=<infrastructure_id> 14 primarySubnet: <rhosp_subnet_UUID> 15 securityGroups: - filter: {} name: <infrastructure_id>-worker 16 serverMetadata: Name: <infrastructure_id>-worker 17 openshiftClusterID: <infrastructure_id> 18 tags: - openshiftClusterID=<infrastructure_id> 19 trunk: true userDataSecret: name: worker-user-data 20 availabilityZone: <optional_openstack_availability_zone>
- 1 5 7 14 16 17 18 19
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 8 9 20
<infra>
노드 레이블을 지정합니다.- 4 6 10
- 인프라 ID 및
<infra>
노드 레이블을 지정합니다. - 11
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다. - 12
- MachineSet의 서버 그룹 정책을 설정하려면, 서버 그룹 생성에서 반환된 값을 입력합니다. 대부분의 배포에는
anti-affinity
또는soft-anti-affinity
정책이 권장됩니다. - 13
- 여러 네트워크에 배포해야 합니다. 여러 네트워크에 배포하는 경우 이 목록에는
primarySubnet
값으로 사용되는 네트워크를 포함해야 합니다. - 15
- 노드 엔드포인트를 게시할 RHOSP 서브넷을 지정합니다. 일반적으로 이 서브넷은
install-config.yaml
파일에서machineSubnet
값으로 사용되는 서브넷과 동일합니다.
8.2.1.9. RHV에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 RHV에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/<node_role>: ""
로 레이블이 지정된 노드를 만듭니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <role>
은 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 name: <infrastructure_id>-<role> 4 namespace: openshift-machine-api spec: replicas: <number_of_replicas> 5 Selector: 6 matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 8 template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 9 machine.openshift.io/cluster-api-machine-role: <role> 10 machine.openshift.io/cluster-api-machine-type: <role> 11 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> 12 spec: metadata: labels: node-role.kubernetes.io/<role>: "" 13 providerSpec: value: apiVersion: ovirtproviderconfig.machine.openshift.io/v1beta1 cluster_id: <ovirt_cluster_id> 14 template_name: <ovirt_template_name> 15 sparse: <boolean_value> 16 format: <raw_or_cow> 17 cpu: 18 sockets: <number_of_sockets> 19 cores: <number_of_cores> 20 threads: <number_of_threads> 21 memory_mb: <memory_size> 22 guaranteed_memory_mb: <memory_size> 23 os_disk: 24 size_gb: <disk_size> 25 storage_domain_id: <storage_domain_UUID> 26 network_interfaces: 27 vnic_profile_id: <vnic_profile_id> 28 credentialsSecret: name: ovirt-credentials 29 kind: OvirtMachineProviderSpec type: <workload_type> 30 auto_pinning_policy: <auto_pinning_policy> 31 hugepages: <hugepages> 32 affinityGroupsNames: - compute 33 userDataSecret: name: worker-user-data
- 1 7 9
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 3 10 11 13
- 추가할 노드 레이블을 지정합니다.
- 4 8 12
- 인프라 ID 및 노드 레이블을 지정합니다. 이 두 문자열은 35자를 초과할 수 없습니다.
- 5
- 생성할 머신 수를 지정합니다.
- 6
- 머신의 선택기입니다.
- 14
- 이 VM 인스턴스가 속하는 RHV 클러스터의 UUID를 지정합니다.
- 15
- 머신을 생성하는 데 사용할 RHV VM 템플릿을 지정합니다.
- 16
- 이 옵션을
false
로 설정하면 디스크를 사전 할당할 수 있습니다. 기본값은true
입니다.원시
로 설정된형식을
true
로 설정하여스파
스를 true로 설정하는 것은 블록 스토리지 도메인에는 사용할 수 없습니다.raw
형식은 전체 가상 디스크를 기본 물리 디스크에 씁니다. - 17
- ss 또는
raw
로설정할
수 있습니다. 기본값은 sac입니다
. 소란형식은
가상 머신에 최적화되어 있습니다.참고파일 스토리지 도메인에서 디스크를 사전 할당하면 파일에 0을 씁니다. 실제로 기본 스토리지에 따라 디스크를 사전 할당하지 않을 수 있습니다.
- 18
- 선택 사항: CPU 필드에 소켓, 코어 및 스레드를 포함한 CPU 구성이 포함되어 있습니다.
- 19
- 선택 사항: VM의 소켓 수를 지정합니다.
- 20
- 선택 사항: 소켓당 코어 수를 지정합니다.
- 21
- 선택 사항: 코어당 스레드 수를 지정합니다.
- 22
- 선택 사항: VM의 메모리 크기를 MiB로 지정합니다.
- 23
- 선택 사항: 가상 머신의 보장된 메모리 크기를 MiB로 지정합니다. 이는 ballooning 메커니즘에 의해 드레이닝되지 않도록 보장되는 메모리 양입니다. 자세한 내용은 설명 된 메모리 설정 및 최적화 설정을 참조하십시오.참고
RHV 4.4.8 이전 버전을 사용하는 경우 Red Hat Virtualization 클러스터에서 OpenShift에 대한 Guaranteed 메모리 요구 사항을 참조하십시오.
- 24
- 선택사항: 노드의 루트 디스크입니다.
- 25
- 선택사항: 부팅 가능한 디스크 크기를 GiB로 지정합니다.
- 26
- 선택 사항: 컴퓨팅 노드 디스크의 스토리지 도메인의 UUID를 지정합니다. 제공되지 않으면 compute 노드가 컨트롤 노드와 동일한 스토리지 도메인에서 생성됩니다. (기본값)
- 27
- 선택사항: VM의 네트워크 인터페이스 목록입니다. 이 매개변수를 포함하는 경우 OpenShift Container Platform은 템플릿에서 모든 네트워크 인터페이스를 삭제하고 새 네트워크 인터페이스를 생성합니다.
- 28
- 선택사항: vNIC 프로필 ID를 지정합니다.
- 29
- RHV 인증 정보를 보유한 보안 오브젝트의 이름을 지정합니다.
- 30
- 선택 사항: 인스턴스가 최적화된 워크로드 유형을 지정합니다. 이 값은
RHV VM
매개변수에 영향을 미칩니다. 지원되는 값은desktop
,server
(기본값),high_performance
입니다.high_performance
는 VM의 성능을 향상시킵니다. 제한 사항은 예를 들어 그래픽 콘솔을 사용하여 VM에 액세스할 수 없습니다. 자세한 내용은 가상 머신 관리 가이드에서 고성능 가상 머신, 템플릿 및 풀 구성을 참조하십시오. - 31
- 선택 사항: AutoPinningPolicy는 이 인스턴스의 호스트에 고정을 포함하여 CPU 및 NUMA 설정을 자동으로 설정하는 정책을 정의합니다. 지원되는 값:
none
,resize_and_pin
. 자세한 내용은 가상 머신 관리 가이드에서 NUMA 노드 설정을 참조하십시오. - 32
- 선택 사항: Hugepages는 VM에서 hugepages를 정의하는 KiB 크기입니다. 지원되는 값:
2048
또는1048576
. 자세한 내용은 가상 머신 관리 가이드에서 Huge Pages 구성을 참조하십시오. - 33
- 선택 사항: VM에 적용할 선호도 그룹 이름 목록입니다. 선호도 그룹은 oVirt에 있어야 합니다.
RHV는 VM을 생성할 때 템플릿을 사용하므로 선택적 매개변수에 대한 값을 지정하지 않으면 RHV는 템플릿에 지정된 해당 매개변수의 값을 사용합니다.
8.2.1.10. vSphere에서 컴퓨팅 머신 세트 사용자 정의 리소스의 샘플 YAML
이 샘플 YAML은 VMware vSphere에서 실행되는 컴퓨팅 머신 세트를 정의하고 node-role.kubernetes.io/infra: ""
로 레이블이 지정된 노드를 생성합니다.
이 샘플에서 <infrastructure_id>
는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID 레이블이며 <infra>
는 추가할 노드 레이블입니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-infra 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 3 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra 4 template: metadata: creationTimestamp: null labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 5 machine.openshift.io/cluster-api-machine-role: <infra> 6 machine.openshift.io/cluster-api-machine-type: <infra> 7 machine.openshift.io/cluster-api-machineset: <infrastructure_id>-infra 8 spec: metadata: creationTimestamp: null labels: node-role.kubernetes.io/infra: "" 9 taints: 10 - key: node-role.kubernetes.io/infra effect: NoSchedule providerSpec: value: apiVersion: vsphereprovider.openshift.io/v1beta1 credentialsSecret: name: vsphere-cloud-credentials diskGiB: 120 kind: VSphereMachineProviderSpec memoryMiB: 8192 metadata: creationTimestamp: null network: devices: - networkName: "<vm_network_name>" 11 numCPUs: 4 numCoresPerSocket: 1 snapshot: "" template: <vm_template_name> 12 userDataSecret: name: worker-user-data workspace: datacenter: <vcenter_datacenter_name> 13 datastore: <vcenter_datastore_name> 14 folder: <vcenter_vm_folder_path> 15 resourcepool: <vsphere_resource_pool> 16 server: <vcenter_server_ip> 17
- 1 3 5
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다. OpenShift CLI (
oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2 4 8
- 인프라 ID 및
<infra>
노드 레이블을 지정합니다. - 6 7 9
<infra>
노드 레이블을 지정합니다.- 10
- 사용자 워크로드가 인프라 노드에서 예약되지 않도록 테인트를 지정합니다.참고
인프라 노드에
NoSchedule
테인트를 추가하면 해당 노드에서 실행 중인 기존 DNS Pod가잘못된 일정
으로 표시됩니다.잘못된 예약
DNS Pod에서 허용 오차를 삭제하거나 추가해야 합니다. - 11
- 컴퓨팅 머신 세트를 배포할 vSphere VM 네트워크를 지정합니다. 이 VM 네트워크는 클러스터에 다른 컴퓨팅 시스템이 상주하는 위치여야 합니다.
- 12
- 사용할 vSphere VM 템플릿 (예:
user-5ddjd-rhcos)
을 지정합니다. - 13
- 컴퓨팅 머신 세트를 배포할 vCenter Datacenter를 지정합니다.
- 14
- 컴퓨팅 머신 세트를 배포할 vCenter Datastore를 지정합니다.
- 15
- vCenter의 vSphere VM 폴더에 경로(예:
/dc1/vm/user-inst-5ddjd
)를 지정합니다. - 16
- VM의 vSphere 리소스 풀을 지정합니다.
- 17
- vCenter 서버 IP 또는 정규화된 도메인 이름을 지정합니다.
8.2.2. 컴퓨팅 머신 세트 생성
설치 프로그램에서 생성한 컴퓨팅 머신 세트 외에도 고유한 머신 세트를 생성하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포합니다.
-
OpenShift CLI(
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로oc
에 로그인합니다.
절차
컴퓨팅 머신 세트 CR(사용자 정의 리소스) 샘플이 포함된 새 YAML 파일을 만들고 <
file_name>.yaml
이라는 이름을 지정합니다.<clusterID>
및<role>
매개 변수 값을 설정해야 합니다.선택 사항: 특정 필드에 설정할 값이 확실하지 않은 경우 클러스터에서 기존 컴퓨팅 머신 세트를 확인할 수 있습니다.
클러스터의 컴퓨팅 머신 세트를 나열하려면 다음 명령을 실행합니다.
$ oc get machinesets -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
특정 컴퓨팅 머신 세트 CR(사용자 정의 리소스)의 값을 보려면 다음 명령을 실행합니다.
$ oc get machineset <machineset_name> \ -n openshift-machine-api -o yaml
출력 예
apiVersion: machine.openshift.io/v1beta1 kind: MachineSet metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> 1 name: <infrastructure_id>-<role> 2 namespace: openshift-machine-api spec: replicas: 1 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> template: metadata: labels: machine.openshift.io/cluster-api-cluster: <infrastructure_id> machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <infrastructure_id>-<role> spec: providerSpec: 3 ...
다음 명령을 실행하여
MachineSet
CR을 생성합니다.$ oc create -f <file_name>.yaml
검증
다음 명령을 실행하여 컴퓨팅 머신 세트 목록을 확인합니다.
$ oc get machineset -n openshift-machine-api
출력 예
NAME DESIRED CURRENT READY AVAILABLE AGE agl030519-vplxk-infra-us-east-1a 1 1 1 1 11m agl030519-vplxk-worker-us-east-1a 1 1 1 1 55m agl030519-vplxk-worker-us-east-1b 1 1 1 1 55m agl030519-vplxk-worker-us-east-1c 1 1 1 1 55m agl030519-vplxk-worker-us-east-1d 0 0 55m agl030519-vplxk-worker-us-east-1e 0 0 55m agl030519-vplxk-worker-us-east-1f 0 0 55m
새 컴퓨팅 머신 세트를 사용할 수 있으면
DESIRED
및CURRENT
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
8.2.3. 인프라 노드 생성
설치 관리자 프로비저닝 인프라 환경 또는 머신 API에서 컨트롤 플레인 노드를 관리하는 클러스터의 인프라 머신 세트 생성을 참조하십시오.
클러스터의 요구 사항은 infra
노드라고도 불리는 인프라를 프로비저닝해야 합니다. 설치 프로그램은 컨트롤 플레인 및 작업자 노드에 대한 프로비저닝만 제공합니다. 작업자 노드는 레이블을 통해 인프라 노드 또는 애플리케이션 ( app, app
이라고도 함)으로 지정할 수 있습니다.
절차
애플리케이션 노드 역할을 수행할 작업자 노드에 레이블을 추가합니다.
$ oc label node <node-name> node-role.kubernetes.io/app=""
인프라 노드 역할을 수행할 작업자 노드에 레이블을 추가합니다.
$ oc label node <node-name> node-role.kubernetes.io/infra=""
해당 노드에
infra
역할 및app
역할이 있는지 확인합니다.$ oc get nodes
기본 클러스터 수준 노드 선택기를 생성합니다. 기본 노드 선택기는 모든 네임스페이스에서 생성된 Pod에 적용됩니다. 이렇게 하면 Pod의 기존 노드 선택기와 교차점이 생성되어 Pod의 선택기가 추가로 제한됩니다.
중요기본 노드 선택기 키가 Pod 라벨 키와 충돌하는 경우 기본 노드 선택기가 적용되지 않습니다.
그러나 Pod를 예약할 수 없게 만들 수 있는 기본 노드 선택기를 설정하지 마십시오. 예를 들어 Pod의 라벨이
node-role.kubernetes.io/master=""
와 같은 다른 노드 역할로 설정된 경우 기본 노드 선택기를node-role.kubernetes.io/infra=""
와 같은 특정 노드 역할로 설정하면 Pod를 예약할 수 없게 될 수 있습니다. 따라서 기본 노드 선택기를 특정 노드 역할로 설정할 때 주의해야 합니다.또는 프로젝트 노드 선택기를 사용하여 클러스터 수준 노드 선택기 키 충돌을 방지할 수 있습니다.
Scheduler
오브젝트를 편집합니다.$ oc edit scheduler cluster
적절한 노드 선택기를 사용하여
defaultNodeSelector
필드를 추가합니다.apiVersion: config.openshift.io/v1 kind: Scheduler metadata: name: cluster spec: defaultNodeSelector: node-role.kubernetes.io/infra="" 1 # ...
- 1
- 이 예제 노드 선택기는 기본적으로 인프라 노드에 Pod를 배포합니다.
- 파일을 저장하여 변경 사항을 적용합니다.
이제 인프라 리소스를 새로 레이블이 지정된 인프라 노드로 이동할 수 있습니다.
추가 리소스
8.2.4. 인프라 머신의 머신 구성 풀 생성
전용 구성을 위한 인프라 머신이 필요한 경우 인프라 풀을 생성해야 합니다.
절차
특정 레이블이 있는 인프라 노드로 할당하려는 노드에 레이블을 추가합니다.
$ oc label node <node_name> <label>
$ oc label node ci-ln-n8mqwr2-f76d1-xscn2-worker-c-6fmtx node-role.kubernetes.io/infra=
작업자 역할과 사용자 지정 역할을 모두 포함하는 머신 구성 풀을 머신 구성 선택기로 생성합니다.
$ cat infra.mcp.yaml
출력 예
apiVersion: machineconfiguration.openshift.io/v1 kind: MachineConfigPool metadata: name: infra spec: machineConfigSelector: matchExpressions: - {key: machineconfiguration.openshift.io/role, operator: In, values: [worker,infra]} 1 nodeSelector: matchLabels: node-role.kubernetes.io/infra: "" 2
참고사용자 지정 머신 구성 풀은 작업자 풀의 머신 구성을 상속합니다. 사용자 지정 풀은 작업자 풀을 대상으로 하는 머신 구성을 사용하지만 사용자 지정 풀을 대상으로 하는 변경 사항만 배포할 수 있는 기능을 추가합니다. 사용자 지정 풀은 작업자 풀에서 리소스를 상속하므로 작업자 풀을 변경하면 사용자 지정 풀에도 영향을 줍니다.
YAML 파일이 있으면 머신 구성 풀을 생성할 수 있습니다.
$ oc create -f infra.mcp.yaml
머신 구성을 확인하고 인프라 구성이 성공적으로 렌더링되었는지 확인합니다.
$ oc get machineconfig
출력 예
NAME GENERATEDBYCONTROLLER IGNITIONVERSION CREATED 00-master 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 00-worker 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 01-master-container-runtime 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 01-master-kubelet 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 01-worker-container-runtime 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 01-worker-kubelet 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 99-master-1ae2a1e0-a115-11e9-8f14-005056899d54-registries 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 99-master-ssh 3.2.0 31d 99-worker-1ae64748-a115-11e9-8f14-005056899d54-registries 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 31d 99-worker-ssh 3.2.0 31d rendered-infra-4e48906dca84ee702959c71a53ee80e7 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 23m rendered-master-072d4b2da7f88162636902b074e9e28e 5b6fb8349a29735e48446d435962dec4547d3090 3.2.0 31d rendered-master-3e88ec72aed3886dec061df60d16d1af 02c07496ba0417b3e12b78fb32baf6293d314f79 3.2.0 31d rendered-master-419bee7de96134963a15fdf9dd473b25 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 17d rendered-master-53f5c91c7661708adce18739cc0f40fb 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 13d rendered-master-a6a357ec18e5bce7f5ac426fc7c5ffcd 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 7d3h rendered-master-dc7f874ec77fc4b969674204332da037 5b6fb8349a29735e48446d435962dec4547d3090 3.2.0 31d rendered-worker-1a75960c52ad18ff5dfa6674eb7e533d 5b6fb8349a29735e48446d435962dec4547d3090 3.2.0 31d rendered-worker-2640531be11ba43c61d72e82dc634ce6 5b6fb8349a29735e48446d435962dec4547d3090 3.2.0 31d rendered-worker-4e48906dca84ee702959c71a53ee80e7 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 7d3h rendered-worker-4f110718fe88e5f349987854a1147755 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 17d rendered-worker-afc758e194d6188677eb837842d3b379 02c07496ba0417b3e12b78fb32baf6293d314f79 3.2.0 31d rendered-worker-daa08cc1e8f5fcdeba24de60cd955cc3 365c1cfd14de5b0e3b85e0fc815b0060f36ab955 3.2.0 13d
rendered-infra-*
접두사가 있는 새 머신 구성이 표시되어야 합니다.선택 사항: 사용자 지정 풀에 변경 사항을 배포하려면
infra
와 같은 사용자 지정 풀 이름을 레이블로 사용하는 머신 구성을 생성합니다. 필수 사항은 아니며 지침 용도로만 표시됩니다. 이렇게 하면 인프라 노드에 고유한 사용자 지정 구성을 적용할 수 있습니다.참고새 머신 구성 풀을 생성한 후 MCO는 해당 풀에 대해 새로 렌더링된 구성과 해당 풀의 관련 노드를 다시 부팅하여 새 구성을 적용합니다.
머신 구성을 생성합니다.
$ cat infra.mc.yaml
출력 예
apiVersion: machineconfiguration.openshift.io/v1 kind: MachineConfig metadata: name: 51-infra labels: machineconfiguration.openshift.io/role: infra 1 spec: config: ignition: version: 3.2.0 storage: files: - path: /etc/infratest mode: 0644 contents: source: data:,infra
- 1
- 노드에 추가한 레이블을
nodeSelector
로 추가합니다.
머신 구성을 인프라 레이블 노드에 적용합니다.
$ oc create -f infra.mc.yaml
새 머신 구성 풀을 사용할 수 있는지 확인합니다.
$ oc get mcp
출력 예
NAME CONFIG UPDATED UPDATING DEGRADED MACHINECOUNT READYMACHINECOUNT UPDATEDMACHINECOUNT DEGRADEDMACHINECOUNT AGE infra rendered-infra-60e35c2e99f42d976e084fa94da4d0fc True False False 1 1 1 0 4m20s master rendered-master-9360fdb895d4c131c7c4bebbae099c90 True False False 3 3 3 0 91m worker rendered-worker-60e35c2e99f42d976e084fa94da4d0fc True False False 2 2 2 0 91m
이 예에서는 작업자 노드가 인프라 노드로 변경되었습니다.
추가 리소스
- 사용자 지정 풀에서 인프라 머신 그룹화에 대한 자세한 내용은 머신 구성 풀을 사용한 노드 구성 관리를 참조하십시오.
8.3. 인프라 노드에 머신 세트 리소스 할당
인프라 머신 세트를 생성 한 후 worker
및 infra
역할이 새 인프라 노드에 적용됩니다. infra
역할이 적용된 노드는 worker
역할이 적용된 경우에도 환경을 실행하는 데 필요한 총 서브스크립션 수에 포함되지 않습니다.
그러나 인프라 노드가 작업자로 할당되면 사용자 워크로드가 실수로 인프라 노드에 할당될 수 있습니다. 이를 방지하려면 제어하려는 pod에 대한 허용 오차를 적용하고 인프라 노드에 테인트를 적용할 수 있습니다.
8.3.1. 테인트 및 허용 오차를 사용하여 인프라 노드 워크로드 바인딩
infra
및 worker
역할이 할당된 인프라 노드가 있는 경우 사용자 워크로드가 할당되지 않도록 노드를 구성해야 합니다.
인프라 노드에 대해 생성된 이중 infra,worker
레이블을 유지하고 테인트 및 허용 오차를 사용하여 사용자 워크로드가 예약된 노드를 관리하는 것이 좋습니다. 노드에서 worker
레이블을 제거하는 경우 이를 관리할 사용자 지정 풀을 생성해야 합니다. master
또는 worker
이외의 레이블이 있는 노드는 사용자 지정 풀없이 MCO에서 인식되지 않습니다. worker
레이블을 유지 관리하면 사용자 정의 레이블을 선택하는 사용자 정의 풀이 없는 경우 기본 작업자 머신 구성 풀에서 노드를 관리할 수 있습니다. infra
레이블은 총 서브스크립션 수에 포함되지 않는 클러스터와 통신합니다.
사전 요구 사항
-
OpenShift Container Platform 클러스터에서 추가
MachineSet
개체를 구성합니다.
프로세스
인프라 노드에 테인트를 추가하여 사용자 워크로드를 예약하지 않도록합니다.
노드에 테인트가 있는지 확인합니다.
$ oc describe nodes <node_name>
샘플 출력
oc describe node ci-ln-iyhx092-f76d1-nvdfm-worker-b-wln2l Name: ci-ln-iyhx092-f76d1-nvdfm-worker-b-wln2l Roles: worker ... Taints: node-role.kubernetes.io/infra:NoSchedule ...
이 예에서는 노드에 테인트가 있음을 보여줍니다. 다음 단계에서 Pod에 허용 오차를 추가할 수 있습니다.
사용자 워크로드를 예약하지 않도록 테인트를 구성하지 않은 경우 다음을 수행합니다.
$ oc adm taint nodes <node_name> <key>=<value>:<effect>
예를 들면 다음과 같습니다.
$ oc adm taint nodes node1 node-role.kubernetes.io/infra=reserved:NoSchedule
작은 정보다음 YAML을 적용하여 테인트를 추가할 수 있습니다.
kind: Node apiVersion: v1 metadata: name: <node_name> labels: ... spec: taints: - key: node-role.kubernetes.io/infra effect: NoSchedule value: reserved ...
이 예에서는 키
node-role.kubernetes.io/infra
및 taint 효과NoSchedule
이 있는node1
에 taint를 배치합니다.NoSchedule
효과가 있는 노드는 taint를 허용하는 pod만 예약하지만 기존 pod는 노드에서 예약된 상태를 유지할 수 있습니다.참고descheduler를 사용하면 노드 taint를 위반하는 pod가 클러스터에서 제거될 수 있습니다.
NoSchedule Effect와 위의 테인트와 함께 NoExecute Effect를 사용하여 테인트를 추가합니다.
$ oc adm taint nodes <node_name> <key>=<value>:<effect>
예를 들면 다음과 같습니다.
$ oc adm taint nodes node1 node-role.kubernetes.io/infra=reserved:NoExecute
작은 정보다음 YAML을 적용하여 테인트를 추가할 수 있습니다.
kind: Node apiVersion: v1 metadata: name: <node_name> labels: ... spec: taints: - key: node-role.kubernetes.io/infra effect: NoExecute value: reserved ...
이 예에서는
node-role.kubernetes.io/infra
및 taint 효과NoExecute
가 있는node1
에 taint를 배치합니다.NoExecute
효과가 있는 노드는 테인트를 허용하는 Pod만 예약합니다. 이 효과에서는 일치하는 톨러레이션이 없는 노드에서 기존 Pod를 제거합니다.
라우터, 레지스트리 및 모니터링 워크로드와 같이 인프라 노드에서 예약하려는 pod 구성에 대한 허용 오차를 추가합니다. 다음 코드를
Pod
개체 사양에 추가합니다.tolerations: - effect: NoSchedule 1 key: node-role.kubernetes.io/infra 2 value: reserved 3 - effect: NoExecute 4 key: node-role.kubernetes.io/infra 5 operator: Equal 6 value: reserved 7
이 허용 오차는
oc adm taint
명령으로 생성된 taint와 일치합니다. 이 허용 오차가 있는 pod를 인프라 노드에 예약할 수 있습니다.참고OLM을 통해 설치된 Operator의 pod를 인프라 노드로 이동할 수는 없습니다. Operator pod를 이동하는 기능은 각 Operator의 구성에 따라 다릅니다.
- 스케줄러를 사용하여 pod를 인프라 노드에 예약합니다. 자세한 내용은 노드에서 pod 배치 제어에 대한 설명서를 참조하십시오.
추가 리소스
- 노드에 Pod 예약에 대한 일반적인 정보는 스케줄러를 사용하여 Pod 배치 제어를 참조하십시오.
- pod를 인프라 노드로 예약하는 방법에 대한 지침은 인프라 머신 세트로 리소스 이동을 참조하십시오.
- 테인트의 다양한 영향에 대한 자세한 내용은 테인트 및 허용 오차 이해 를 참조하십시오.
8.4. 인프라 머신 세트로 리소스 이동
일부 인프라 리소스는 기본적으로 클러스터에 배포됩니다. 다음과 같이 인프라 노드 선택기를 추가하여 생성한 인프라 머신 세트로 이동할 수 있습니다.
spec:
nodePlacement: 1
nodeSelector:
matchLabels:
node-role.kubernetes.io/infra: ""
tolerations:
- effect: NoSchedule
key: node-role.kubernetes.io/infra
value: reserved
- effect: NoExecute
key: node-role.kubernetes.io/infra
value: reserved
- 1
- 적절한 값이 설정된
nodeSelector
매개변수를 이동하려는 구성 요소에 추가합니다. 표시된 형식으로nodeSelector
를 사용하거나 노드에 지정된 값에 따라<key>: <value>
쌍을 사용할 수 있습니다. 인프라 노드에 테인트를 추가한 경우 일치하는 톨러레이션도 추가합니다.
모든 인프라 구성 요소에 특정 노드 선택기를 적용하면 OpenShift Container Platform에서 해당 라벨이 있는 노드에 해당 워크로드를 예약합니다.
8.4.1. 라우터 이동
라우터 Pod를 다른 컴퓨팅 머신 세트에 배포할 수 있습니다. 기본적으로 Pod는 작업자 노드에 배포됩니다.
전제 조건
- OpenShift Container Platform 클러스터에서 추가 컴퓨팅 머신 세트를 구성합니다.
프로세스
라우터 Operator의
IngressController
사용자 정의 리소스를 표시합니다.$ oc get ingresscontroller default -n openshift-ingress-operator -o yaml
명령 출력은 다음 예제와 유사합니다.
apiVersion: operator.openshift.io/v1 kind: IngressController metadata: creationTimestamp: 2019-04-18T12:35:39Z finalizers: - ingresscontroller.operator.openshift.io/finalizer-ingresscontroller generation: 1 name: default namespace: openshift-ingress-operator resourceVersion: "11341" selfLink: /apis/operator.openshift.io/v1/namespaces/openshift-ingress-operator/ingresscontrollers/default uid: 79509e05-61d6-11e9-bc55-02ce4781844a spec: {} status: availableReplicas: 2 conditions: - lastTransitionTime: 2019-04-18T12:36:15Z status: "True" type: Available domain: apps.<cluster>.example.com endpointPublishingStrategy: type: LoadBalancerService selector: ingresscontroller.operator.openshift.io/deployment-ingresscontroller=default
ingresscontroller
리소스를 편집하고infra
레이블을 사용하도록nodeSelector
를 변경합니다.$ oc edit ingresscontroller default -n openshift-ingress-operator
spec: nodePlacement: nodeSelector: 1 matchLabels: node-role.kubernetes.io/infra: "" tolerations: - effect: NoSchedule key: node-role.kubernetes.io/infra value: reserved - effect: NoExecute key: node-role.kubernetes.io/infra value: reserved
- 1
- 적절한 값이 설정된
nodeSelector
매개변수를 이동하려는 구성 요소에 추가합니다. 표시된 형식으로nodeSelector
를 사용하거나 노드에 지정된 값에 따라<key>: <value>
쌍을 사용할 수 있습니다. 인프라 노드에 테인트를 추가한 경우 일치하는 허용 오차도 추가합니다.
라우터 pod가
infra
노드에서 실행되고 있는지 확인합니다.라우터 pod 목록을 표시하고 실행중인 pod의 노드 이름을 기록해 둡니다.
$ oc get pod -n openshift-ingress -o wide
출력 예
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES router-default-86798b4b5d-bdlvd 1/1 Running 0 28s 10.130.2.4 ip-10-0-217-226.ec2.internal <none> <none> router-default-955d875f4-255g8 0/1 Terminating 0 19h 10.129.2.4 ip-10-0-148-172.ec2.internal <none> <none>
이 예에서 실행중인 pod는
ip-10-0-217-226.ec2.internal
노드에 있습니다.실행중인 pod의 노드 상태를 표시합니다.
$ oc get node <node_name> 1
- 1
- pod 목록에서 얻은
<node_name>
을 지정합니다.
출력 예
NAME STATUS ROLES AGE VERSION ip-10-0-217-226.ec2.internal Ready infra,worker 17h v1.26.0
역할 목록에
infra
가 포함되어 있으므로 pod가 올바른 노드에서 실행됩니다.
8.4.2. 기본 레지스트리 이동
Pod를 다른 노드에 배포하도록 레지스트리 Operator를 구성합니다.
전제 조건
- OpenShift Container Platform 클러스터에서 추가 컴퓨팅 머신 세트를 구성합니다.
프로세스
config/instance
개체를 표시합니다.$ oc get configs.imageregistry.operator.openshift.io/cluster -o yaml
출력 예
apiVersion: imageregistry.operator.openshift.io/v1 kind: Config metadata: creationTimestamp: 2019-02-05T13:52:05Z finalizers: - imageregistry.operator.openshift.io/finalizer generation: 1 name: cluster resourceVersion: "56174" selfLink: /apis/imageregistry.operator.openshift.io/v1/configs/cluster uid: 36fd3724-294d-11e9-a524-12ffeee2931b spec: httpSecret: d9a012ccd117b1e6616ceccb2c3bb66a5fed1b5e481623 logging: 2 managementState: Managed proxy: {} replicas: 1 requests: read: {} write: {} storage: s3: bucket: image-registry-us-east-1-c92e88cad85b48ec8b312344dff03c82-392c region: us-east-1 status: ...
config/instance
개체를 편집합니다.$ oc edit configs.imageregistry.operator.openshift.io/cluster
spec: affinity: podAntiAffinity: preferredDuringSchedulingIgnoredDuringExecution: - podAffinityTerm: namespaces: - openshift-image-registry topologyKey: kubernetes.io/hostname weight: 100 logLevel: Normal managementState: Managed nodeSelector: 1 node-role.kubernetes.io/infra: "" tolerations: - effect: NoSchedule key: node-role.kubernetes.io/infra value: reserved - effect: NoExecute key: node-role.kubernetes.io/infra value: reserved
- 1
- 적절한 값이 설정된
nodeSelector
매개변수를 이동하려는 구성 요소에 추가합니다. 표시된 형식으로nodeSelector
를 사용하거나 노드에 지정된 값에 따라<key>: <value>
쌍을 사용할 수 있습니다. 인프라 노드에 테인트를 추가한 경우 일치하는 톨러레이션도 추가합니다.
레지스트리 pod가 인프라 노드로 이동되었는지 검증합니다.
다음 명령을 실행하여 레지스트리 pod가 있는 노드를 식별합니다.
$ oc get pods -o wide -n openshift-image-registry
노드에 지정된 레이블이 있는지 확인합니다.
$ oc describe node <node_name>
명령 출력을 확인하고
node-role.kubernetes.io/infra
가LABELS
목록에 있는지 확인합니다.
8.4.3. 모니터링 솔루션 이동
모니터링 스택에는 Prometheus, Thanos Querier, Alertmanager를 비롯한 여러 구성 요소가 포함됩니다. Cluster Monitoring Operator는 이 스택을 관리합니다. 모니터링 스택을 인프라 노드에 재배포하려면 사용자 정의 구성 맵을 생성하고 적용할 수 있습니다.
전제 조건
-
cluster-admin
클러스터 역할의 사용자로 클러스터에 액세스할 수 있습니다. -
cluster-monitoring-config
ConfigMap
오브젝트를 생성하셨습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다.
프로세스
cluster-monitoring-config
구성 맵을 편집하고infra
레이블을 사용하도록nodeSelector
를 변경합니다.$ oc edit configmap cluster-monitoring-config -n openshift-monitoring
apiVersion: v1 kind: ConfigMap metadata: name: cluster-monitoring-config namespace: openshift-monitoring data: config.yaml: |+ alertmanagerMain: nodeSelector: 1 node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute prometheusK8s: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute prometheusOperator: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute k8sPrometheusAdapter: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute kubeStateMetrics: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute telemeterClient: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute openshiftStateMetrics: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute thanosQuerier: nodeSelector: node-role.kubernetes.io/infra: "" tolerations: - key: node-role.kubernetes.io/infra value: reserved effect: NoSchedule - key: node-role.kubernetes.io/infra value: reserved effect: NoExecute
- 1
- 적절한 값이 설정된
nodeSelector
매개변수를 이동하려는 구성 요소에 추가합니다. 표시된 형식으로nodeSelector
를 사용하거나 노드에 지정된 값에 따라<key>: <value>
쌍을 사용할 수 있습니다. 인프라 노드에 테인트를 추가한 경우 일치하는 톨러레이션도 추가합니다.
모니터링 pod가 새 머신으로 이동하는 것을 확인합니다.
$ watch 'oc get pod -n openshift-monitoring -o wide'
구성 요소가
infra
노드로 이동하지 않은 경우 이 구성 요소가 있는 pod를 제거합니다.$ oc delete pod -n openshift-monitoring <pod>
삭제된 pod의 구성 요소가
infra
노드에 다시 생성됩니다.
9장. OpenShift Container Platform 클러스터에 RHEL 컴퓨팅 머신 추가
OpenShift Container Platform에서는 RHEL(Red Hat Enterprise Linux) 컴퓨팅 머신을 사용자 프로비저닝 인프라 클러스터 또는 x86_64
아키텍처에서 설치 프로비저닝 인프라 클러스터에 추가할 수 있습니다. 컴퓨팅 머신에서만 RHEL을 운영 체제로 사용할 수 있습니다.
9.1. 클러스터에 RHEL 컴퓨팅 노드 추가 정보
x86_64
아키텍처에서 사용자 프로비저닝 또는 설치 관리자 프로비저닝 인프라 설치를 사용하는 경우 OpenShift Container Platform 4.13에서는 RHEL (Red Hat Enterprise Linux) 머신을 클러스터의 컴퓨팅 머신으로 사용하는 옵션이 있습니다. 클러스터의 컨트롤 플레인 시스템에 RHCOS(Red Hat Enterprise Linux CoreOS) 머신을 사용해야 합니다.
클러스터에서 RHEL 컴퓨팅 머신을 사용하기로 선택한 경우 모든 운영 체제의 라이프 사이클 관리 및 유지 관리를 담당합니다. 시스템 업데이트를 수행하고 패치를 적용하고 기타 필요한 모든 작업을 완료해야 합니다.
설치 관리자 프로비저닝 인프라 클러스터의 경우 설치 관리자 프로비저닝 인프라 클러스터에서 자동으로 확장되어 RHCOS(Red Hat Enterprise Linux CoreOS) 컴퓨팅 머신을 기본적으로 추가하므로 RHEL 컴퓨팅 머신을 수동으로 추가해야 합니다.
- 클러스터의 시스템에서 OpenShift Container Platform을 제거하려면 운영 체제를 제거해야하므로 클러스터에 추가한 모든 RHEL 머신에 전용 하드웨어를 사용해야합니다.
- OpenShift Container Platform 클러스터에 추가한 모든 RHEL 머신에서 스왑 메모리가 비활성화됩니다. 이 머신에서 스왑 메모리를 활성화할 수 없습니다.
9.2. RHEL 컴퓨팅 노드의 시스템 요구 사항
OpenShift Container Platform 환경의 RHEL (Red Hat Enterprise Linux) 컴퓨팅 머신 호스트는 다음과 같은 최소 하드웨어 사양 및 시스템 수준 요구 사항을 충족해야합니다.
- Red Hat 계정에 유효한 OpenShift Container Platform 서브스크립션이 있어야합니다. 서브스크립션이 없는 경우 영업 담당자에게 자세한 내용을 문의하십시오.
- 프로덕션 환경에서 예상 워크로드를 지원할 수 있는 컴퓨팅 머신을 제공해야합니다. 클러스터 관리자는 예상 워크로드를 계산하고 오버 헤드에 약 10%를 추가해야합니다. 프로덕션 환경의 경우 노드 호스트 장애가 최대 용량에 영향을 미치지 않도록 충분한 리소스를 할당해야 합니다.
각 시스템은 다음 하드웨어 요구 사항을 충족해야합니다.
- 물리적 또는 가상 시스템 또는 퍼블릭 또는 프라이빗 IaaS에서 실행되는 인스턴스.
기본 OS: RHEL 8.6 이상, "최소" 설치 옵션이 있습니다.
중요OpenShift Container Platform 클러스터에 RHEL 7 컴퓨팅 머신을 추가하는 것은 지원되지 않습니다.
이전에 OpenShift Container Platform 버전에서 지원되는 RHEL 7 컴퓨팅 머신이 있는 경우 RHEL 8로 업그레이드할 수 없습니다. 새 RHEL 8 호스트를 배포해야 하며 이전 RHEL 7 호스트를 제거해야 합니다. 자세한 내용은 "노드 삭제" 섹션을 참조하십시오.
OpenShift Container Platform에서 더 이상 사용되지 않거나 삭제된 주요 기능의 최신 목록은 OpenShift Container Platform 릴리스 노트에서 더 이상 사용되지 않고 삭제된 기능 섹션을 참조하십시오.
- NetworkManager 1.0 이상
- vCPU 1개
- 최소 8GB RAM
-
/var/
를 포함하는 파일 시스템의 최소 15GB 하드 디스크 공간 -
/usr/local/bin/
을 포함하는 파일 시스템의 최소 1GB 하드 디스크 공간 임시 디렉토리를 포함하는 파일 시스템의 최소 1GB의 하드 디스크 공간 임시 시스템 디렉토리는 Python 표준 라이브러리의 tempfile 모듈에 정의된 규칙에 따라 결정됩니다.
-
각 시스템은 시스템 제공 업체의 추가 요구 사항을 충족해야합니다. 예를 들어 VMware vSphere에 클러스터를 설치하는 경우 스토리지 지침에 따라 디스크를 구성하고
disk.enableUUID=true
속성을 설정해야합니다. - 각 시스템은 DNS 확인 가능한 호스트 이름을 사용하여 클러스터의 API 끝점에 액세스할 수 있어야 합니다. 모든 네트워크 보안 액세스 제어는 클러스터의 API 서비스 엔드 포인트에 대한 시스템 액세스를 허용해야합니다.
-
각 시스템은 시스템 제공 업체의 추가 요구 사항을 충족해야합니다. 예를 들어 VMware vSphere에 클러스터를 설치하는 경우 스토리지 지침에 따라 디스크를 구성하고
추가 리소스
9.2.1. 인증서 서명 요청 관리
사용자가 프로비저닝하는 인프라를 사용하는 경우 자동 시스템 관리 기능으로 인해 클러스터의 액세스가 제한되므로 설치한 후 클러스터 인증서 서명 요청(CSR)을 승인하는 메커니즘을 제공해야 합니다. kube-controller-manager
는 kubelet 클라이언트 CSR만 승인합니다. machine-approver
는 올바른 시스템에서 발행한 요청인지 확인할 수 없기 때문에 kubelet 자격 증명을 사용하여 요청하는 서비스 인증서의 유효성을 보장할 수 없습니다. kubelet 서빙 인증서 요청의 유효성을 확인하고 요청을 승인하는 방법을 결정하여 구현해야 합니다.
9.3. 클라우드 이미지 준비
AWS에서 다양한 이미지 형식을 직접 사용할 수 없기 때문에 Amazon 머신 이미지(AMI)가 필요합니다. Red Hat에서 제공하는 AMI를 사용하거나 자체 이미지를 수동으로 가져올 수 있습니다. EC2 인스턴스를 프로비저닝하기 전에 AMI가 있어야 합니다. 컴퓨팅 시스템에 필요한 올바른 RHEL 버전이 선택하려면유효한 AMI ID가 필요합니다.
9.3.1. AWS에서 사용 가능한 최신 RHEL 이미지 나열
AMI ID는 AWS의 기본 부팅 이미지에 해당합니다. AMI는 EC2 인스턴스를 프로비저닝하기 전에 존재해야 하므로 구성 전에 AMI ID를 알아야 합니다. AWS CLI(Command Line Interface)는 사용 가능한 RHEL(Red Hat Enterprise Linux) 이미지 ID를 나열하는 데 사용됩니다.
사전 요구 사항
- AWS CLI를 설치했습니다.
절차
이 명령을 사용하여 RHEL 8.4 AMI(Amazon Machine Images)를 나열합니다.
$ aws ec2 describe-images --owners 309956199498 \ 1 --query 'sort_by(Images, &CreationDate)[*].[CreationDate,Name,ImageId]' \ 2 --filters "Name=name,Values=RHEL-8.4*" \ 3 --region us-east-1 \ 4 --output table 5
- 1
--owners
명령 옵션은 계정 ID309956199498
에 기반한 Red Hat 이미지를 보여줍니다.중요Red Hat에서 제공하는 이미지의 AMI ID를 표시하려면 이 계정 ID가 필요합니다.
- 2
--query
명령 옵션은'sort_by(Images, &CreationDate)[*].[CreationDate,Name,ImageId]
매개변수로 이미지가 정렬되는 방법을 설정합니다. 이 경우 이미지는 생성 날짜에 따라 정렬되며 테이블은 생성 날짜, 이미지 이름 및 AMI ID를 표시하도록 구성됩니다.- 3
--filter
명령 옵션은 표시되는 RHEL 버전을 설정합니다. 이 예에서는 필터가"Name=name,Values=RHEL-8.4*"
로 설정되므로 RHEL 8.4 AMI가 표시됩니다.- 4
--region
명령 옵션은 AMI가 저장된 리전을 설정합니다.- 5
--output
명령 옵션은 결과가 표시되는 방법을 설정합니다.
AWS용 RHEL 컴퓨팅 머신을 생성할 때 AMI가 RHEL 8.4 또는 8.5인지 확인합니다.
출력 예
------------------------------------------------------------------------------------------------------------ | DescribeImages | +---------------------------+-----------------------------------------------------+------------------------+ | 2021-03-18T14:23:11.000Z | RHEL-8.4.0_HVM_BETA-20210309-x86_64-1-Hourly2-GP2 | ami-07eeb4db5f7e5a8fb | | 2021-03-18T14:38:28.000Z | RHEL-8.4.0_HVM_BETA-20210309-arm64-1-Hourly2-GP2 | ami-069d22ec49577d4bf | | 2021-05-18T19:06:34.000Z | RHEL-8.4.0_HVM-20210504-arm64-2-Hourly2-GP2 | ami-01fc429821bf1f4b4 | | 2021-05-18T20:09:47.000Z | RHEL-8.4.0_HVM-20210504-x86_64-2-Hourly2-GP2 | ami-0b0af3577fe5e3532 | +---------------------------+-----------------------------------------------------+------------------------+
9.4. Playbook 실행을 위한 머신 준비
RHEL(Red Hat Enterprise Linux)을 운영 체제로 사용하는 컴퓨팅 머신을 OpenShift Container Platform 4.13 클러스터에 추가하려면 먼저 새 노드를 클러스터에 추가하는 Ansible 플레이북을 실행하도록 RHEL 8 머신을 준비해야 합니다. 이 머신은 클러스터의 일부가 아니지만 클러스터에 액세스할 수 있어야합니다.
사전 요구 사항
-
Playbook을 실행하는 머신에 OpenShift CLI (
oc
)를 설치합니다. -
cluster-admin
권한이 있는 사용자로 로그인합니다.
프로세스
-
클러스터의
kubeconfig
파일 및 클러스터를 설치하는 데 사용한 설치 프로그램이 RHEL 8 머신에 있는지 확인합니다. 이를 수행하는 한 가지 방법으로 클러스터 설치에 사용된 머신과 동일한 머신을 사용하는 것입니다. - 컴퓨팅 머신으로 사용하려는 모든 RHEL 호스트에 액세스하도록 머신을 구성합니다. SSH 프록시 또는 VPN을 사용하는 Bastion를 포함하여 회사에서 허용하는 모든 방법을 사용할 수 있습니다.
Playbook을 실행하는 머신에서 모든 RHEL 호스트에 대한 SSH 액세스 권한이있는 사용자를 구성하십시오.
중요SSH 키 기반 인증을 사용하는 경우 SSH 에이전트를 사용하여 키를 관리해야합니다.
아직 등록하지 않은 경우 RHSM으로 머신을 등록하고
OpenShift
서브스크립션이 있는 풀을 머신에 연결합니다.RHSM으로 머신를 등록합니다.
# subscription-manager register --username=<user_name> --password=<password>
RHSM에서 최신 서브스크립션 데이터를 가져옵니다.
# subscription-manager refresh
사용 가능한 서브스크립션을 나열하십시오.
# subscription-manager list --available --matches '*OpenShift*'
이전 명령의 출력에서 OpenShift Container Platform 서브스크립션의 풀 ID를 찾아서 이를 연결합니다.
# subscription-manager attach --pool=<pool_id>
OpenShift Container Platform 4.13에 필요한 리포지토리를 활성화합니다.
# subscription-manager repos \ --enable="rhel-8-for-x86_64-baseos-rpms" \ --enable="rhel-8-for-x86_64-appstream-rpms" \ --enable="rhocp-4.13-for-rhel-8-x86_64-rpms"
openshift-ansible
을 포함한 필수 패키지를 설치합니다.# yum install openshift-ansible openshift-clients jq
openshift-ansible
패키지는 설치 프로그램 유틸리티를 제공하고 Ansible, Playbook 및 관련 구성 파일과 같이 RHEL 컴퓨팅 노드를 클러스터에 추가하는데 필요한 다른 패키지를 가져옵니다.openshift-clients
는oc
CLI를 제공하고jq
패키지는 명령 행에서 JSON 출력 표시 방법을 개선할 수 있습니다.
9.5. RHEL 컴퓨팅 노드 준비
RHEL (Red Hat Enterprise Linux) 시스템을 OpenShift Container Platform 클러스터에 추가하기 전에 각 호스트를 RHSM (Red Hat Subscription Manager)에 등록하고 활성 OpenShift Container Platform 서브스크립션을 연결하고 필요한 저장소를 활성화해야합니다.
각 호스트에서 RHSM으로 동륵합니다.
# subscription-manager register --username=<user_name> --password=<password>
RHSM에서 최신 서브스크립션 데이터를 가져옵니다.
# subscription-manager refresh
사용 가능한 서브스크립션을 나열하십시오.
# subscription-manager list --available --matches '*OpenShift*'
이전 명령의 출력에서 OpenShift Container Platform 서브스크립션의 풀 ID를 찾아서 이를 연결합니다.
# subscription-manager attach --pool=<pool_id>
모든 yum 저장소를 비활성화합니다.
활성화된 모든 RHSM 저장소를 비활성화합니다.
# subscription-manager repos --disable="*"
나머지 yum 저장소를 나열하고
repo id
아래에 해당 이름을 적어 둡니다.# yum repolist
yum-config-manager
를 사용하여 나머지 yum 리포지토리를 비활성화합니다.# yum-config-manager --disable <repo_id>
또는 모든 리포지토리를 비활성화합니다.
# yum-config-manager --disable \*
사용 가능한 리포지토리가 많으면 몇 분의 시간이 소요될 수 있습니다.
OpenShift Container Platform 4.13에 필요한 리포지토리를 활성화합니다.
# subscription-manager repos \ --enable="rhel-8-for-x86_64-baseos-rpms" \ --enable="rhel-8-for-x86_64-appstream-rpms" \ --enable="rhocp-4.13-for-rhel-8-x86_64-rpms" \ --enable="fast-datapath-for-rhel-8-x86_64-rpms"
호스트에서 firewalld를 중지하고 비활성화합니다.
# systemctl disable --now firewalld.service
참고나중에 firewalld를 활성화할 수 없습니다. 활성화하면 작업자의 OpenShift Container Platform 로그에 액세스할 수 없습니다.
9.6. AWS의 RHEL 인스턴스에 역할 권한 연결
브라우저에서 Amazon IAM 콘솔을 사용하여 필요한 역할을 선택하고 작업자 노드에 할당할 수 있습니다.
프로세스
- AWS IAM 콘솔에서 원하는 IAM 역할을 생성합니다.
- 원하는 작업자 노드에 IAM 역할을 연결합니다.
추가 리소스
- IAM 역할에 대한 필수 AWS 권한을 참조하십시오.
9.7. RHEL 작업자 노드를 owned 또는 shared로 태그 지정
클러스터는 kubernetes.io/cluster/<clusterid>,Value=(owned|shared)
태그 값을 사용하여 AWS 클러스터와 관련된 리소스의 수명을 결정합니다.
-
클러스터 제거의 일부로 리소스를 제거해야 하는 경우
owned
태그 값을 추가해야 합니다. -
클러스터가 제거된 후에도 리소스가 계속 존재하는 경우
shared
태그 값을 추가해야 합니다. 이 태그는 클러스터가 이 리소스를 사용하지만 리소스에 대해 별도의 소유자가 있음을 나타냅니다.
프로세스
-
RHEL 컴퓨팅 머신의 경우 RHEL 작업자 인스턴스는
kubernetes.io/cluster/<clusterid>=owned
또는kubernetes.io/cluster/<cluster-id>=shared
로 태그 지정해야 합니다.
kubernetes.io/cluster/<name>,Value=<clusterid>
태그로 기존 보안 그룹을 태그하지 마십시오. 그렇지 않으면 ELB(Elastic Load Balancing)에서 로드 밸런서를 생성할 수 없습니다.
9.8. 클러스터에 RHEL 컴퓨팅 머신 추가
Red Hat Enterprise Linux를 운영 체제로 사용하는 컴퓨팅 머신을 OpenShift Container Platform 4.13 클러스터에 추가할 수 있습니다.
사전 요구 사항
- Playbook을 실행하는 머신에 필요한 패키지를 설치하고 필요한 구성이 수행되어 있습니다.
- RHEL 호스트 설치가 준비되어 있습니다.
프로세스
Playbook을 실행할 준비가 되어 있는 머신에서 다음 단계를 수행합니다.
컴퓨팅 머신 호스트 및 필수 변수를 정의하는
/<path>/inventory/hosts
라는 Ansible 인벤토리 파일을 만듭니다.[all:vars] ansible_user=root 1 #ansible_become=True 2 openshift_kubeconfig_path="~/.kube/config" 3 [new_workers] 4 mycluster-rhel8-0.example.com mycluster-rhel8-1.example.com
- 1
- 원격 컴퓨팅 머신에서 Ansible 태스크를 실행하는 사용자 이름을 지정합니다.
- 2
ansible_user
의root
를 지정하지 않으면ansible_become
을True
로 설정하고 사용자 sudo 권한을 지정해야합니다.- 3
- 클러스터
kubeconfig
파일의 경로와 파일 이름을 지정합니다. - 4
- 클러스터에 추가할 각 RHEL 머신을 나열합니다. 각 호스트에 대해 정규화된 도메인 이름을 지정해야합니다. 이 이름은 클러스터가 시스템에 액세스하는 데 사용하는 호스트 이름이므로 올바른 공용 또는 개인 이름을 설정하여 시스템에 액세스합니다.
Ansible Playbook 디렉토리로 이동합니다.
$ cd /usr/share/ansible/openshift-ansible
Playbook을 실행합니다.
$ ansible-playbook -i /<path>/inventory/hosts playbooks/scaleup.yml 1
- 1
<path>
에 대해 생성한 Ansible 인벤토리 파일의 경로를 지정합니다.
9.9. 시스템의 인증서 서명 요청 승인
클러스터에 시스템을 추가하면 추가한 시스템별로 보류 중인 인증서 서명 요청(CSR)이 두 개씩 생성됩니다. 이러한 CSR이 승인되었는지 확인해야 하며, 필요한 경우 이를 직접 승인해야 합니다. 클라이언트 요청을 먼저 승인한 다음 서버 요청을 승인해야 합니다.
사전 요구 사항
- 클러스터에 시스템을 추가했습니다.
프로세스
클러스터가 시스템을 인식하는지 확인합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 63m v1.26.0 master-1 Ready master 63m v1.26.0 master-2 Ready master 64m v1.26.0
출력에 생성된 모든 시스템이 나열됩니다.
참고이전 출력에는 일부 CSR이 승인될 때까지 컴퓨팅 노드(작업자 노드라고도 함)가 포함되지 않을 수 있습니다.
보류 중인 CSR을 검토하고 클러스터에 추가한 각 시스템에 대해
Pending
또는Approved
상태의 클라이언트 및 서버 요청이 표시되는지 확인합니다.$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-8b2br 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending csr-8vnps 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending ...
예에서는 두 시스템이 클러스터에 참여하고 있습니다. 목록에는 승인된 CSR이 더 많이 나타날 수도 있습니다.
CSR이 승인되지 않은 경우, 추가된 시스템에 대한 모든 보류 중인 CSR이
Pending
상태로 전환된 후 클러스터 시스템의 CSR을 승인합니다.참고CSR은 교체 주기가 자동으로 만료되므로 클러스터에 시스템을 추가한 후 1시간 이내에 CSR을 승인하십시오. 한 시간 내에 승인하지 않으면 인증서가 교체되고 각 노드에 대해 두 개 이상의 인증서가 표시됩니다. 이러한 인증서를 모두 승인해야 합니다. 클라이언트 CSR이 승인되면 Kubelet은 인증서에 대한 보조 CSR을 생성하므로 수동 승인이 필요합니다. 그러면 Kubelet에서 동일한 매개변수를 사용하여 새 인증서를 요청하는 경우 인증서 갱신 요청은
machine-approver
에 의해 자동으로 승인됩니다.참고베어 메탈 및 기타 사용자 프로비저닝 인프라와 같이 머신 API를 사용하도록 활성화되지 않는 플랫폼에서 실행되는 클러스터의 경우 CSR(Kubelet service Certificate Request)을 자동으로 승인하는 방법을 구현해야 합니다. 요청이 승인되지 않으면 API 서버가 kubelet에 연결될 때 서비스 인증서가 필요하므로
oc exec
,oc rsh
,oc logs
명령을 성공적으로 수행할 수 없습니다. Kubelet 엔드 포인트에 연결하는 모든 작업을 수행하려면 이 인증서 승인이 필요합니다. 이 방법은 새 CSR을 감시하고 CSR이system:node
또는system:admin
그룹의node-bootstrapper
서비스 계정에 의해 제출되었는지 확인하고 노드의 ID를 확인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs --no-run-if-empty oc adm certificate approve
참고일부 Operator는 일부 CSR이 승인될 때까지 사용할 수 없습니다.
이제 클라이언트 요청이 승인되었으므로 클러스터에 추가한 각 머신의 서버 요청을 검토해야 합니다.
$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-bfd72 5m26s system:node:ip-10-0-50-126.us-east-2.compute.internal Pending csr-c57lv 5m26s system:node:ip-10-0-95-157.us-east-2.compute.internal Pending ...
나머지 CSR이 승인되지 않고
Pending
상태인 경우 클러스터 머신의 CSR을 승인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs oc adm certificate approve
모든 클라이언트 및 서버 CSR이 승인된 후 머신은
Ready
상태가 됩니다. 다음 명령을 실행하여 확인합니다.$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 73m v1.26.0 master-1 Ready master 73m v1.26.0 master-2 Ready master 74m v1.26.0 worker-0 Ready worker 11m v1.26.0 worker-1 Ready worker 11m v1.26.0
참고머신이
Ready
상태로 전환하는 데 서버 CSR의 승인 후 몇 분이 걸릴 수 있습니다.
추가 정보
- CSR에 대한 자세한 내용은 인증서 서명 요청을 참조하십시오.
9.10. Ansible 호스트 파일의 필수 매개 변수
RHEL (Red Hat Enterprise Linux) 컴퓨팅 머신을 클러스터에 추가하기 전에 Ansible 호스트 파일에서 다음 매개 변수를 정의해야합니다.
매개변수 | 설명 | 값 |
---|---|---|
| 암호없이 SSH 기반 인증을 허용하는 SSH 사용자입니다. SSH 키 기반 인증을 사용하는 경우 SSH 에이전트를 사용하여 키를 관리해야합니다. |
시스템의 사용자 이름입니다. 기본값은 |
|
|
|
|
클러스터의 | 구성 파일의 경로 및 이름 |
9.10.1. 선택 사항: 클러스터에서 RHCOS 컴퓨팅 머신 제거
RHEL (Red Hat Enterprise Linux) 컴퓨팅 머신을 클러스터에 추가 한 후 선택 옵션으로 RHCOS (Red Hat Enterprise Linux CoreOS) 컴퓨팅 머신을 제거하여 리소스를 확보할 수 있습니다.
사전 요구 사항
- RHEL 컴퓨팅 머신이 클러스터에 추가되어 있습니다.
절차
머신 목록을 표시하고 RHCOS 컴퓨팅 머신의 노드 이름을 기록합니다.
$ oc get nodes -o wide
각 RHCOS 컴퓨팅 머신의 노드를 제거합니다.
oc adm cordon
명령을 실행하여 노드를 스케줄 예약 해제로 표시합니다.$ oc adm cordon <node_name> 1
- 1
- RHCOS 컴퓨팅 머신의 노드 이름을 지정합니다.
노드에서 모든 pod를 드레인합니다.
$ oc adm drain <node_name> --force --delete-emptydir-data --ignore-daemonsets 1
- 1
- 분리 한 RHCOS 컴퓨팅 머신의 노드 이름을 지정합니다.
노드를 제거합니다.
$ oc delete nodes <node_name> 1
- 1
- 드레인한 RHCOS 컴퓨팅 머신의 노드 이름을 지정합니다.
컴퓨팅 머신 목록을 확인하고 RHEL 노드만 남아 있는지 확인합니다.
$ oc get nodes -o wide
- 클러스터 컴퓨팅 머신의 로드 밸런서에서 RHCOS 머신을 제거합니다. 가상 머신을 삭제하거나 RHCOS 컴퓨팅 머신의 실제 하드웨어를 다시 이미지화 할 수 있습니다.
10장. OpenShift Container Platform 클러스터에 RHEL 컴퓨팅 머신 추가
OpenShift Container Platform 클러스터에 작업자 시스템이라고도하는 RHEL (Red Hat Enterprise Linux) 컴퓨팅 시스템이 이미 포함되어있는 경우 RHEL 컴퓨팅 시스템을 더 추가할 수 있습니다.
10.1. 클러스터에 RHEL 컴퓨팅 노드 추가 정보
x86_64
아키텍처에서 사용자 프로비저닝 또는 설치 관리자 프로비저닝 인프라 설치를 사용하는 경우 OpenShift Container Platform 4.13에서는 RHEL (Red Hat Enterprise Linux) 머신을 클러스터의 컴퓨팅 머신으로 사용하는 옵션이 있습니다. 클러스터의 컨트롤 플레인 시스템에 RHCOS(Red Hat Enterprise Linux CoreOS) 머신을 사용해야 합니다.
클러스터에서 RHEL 컴퓨팅 머신을 사용하기로 선택한 경우 모든 운영 체제의 라이프 사이클 관리 및 유지 관리를 담당합니다. 시스템 업데이트를 수행하고 패치를 적용하고 기타 필요한 모든 작업을 완료해야 합니다.
설치 관리자 프로비저닝 인프라 클러스터의 경우 설치 관리자 프로비저닝 인프라 클러스터에서 자동으로 확장되어 RHCOS(Red Hat Enterprise Linux CoreOS) 컴퓨팅 머신을 기본적으로 추가하므로 RHEL 컴퓨팅 머신을 수동으로 추가해야 합니다.
- 클러스터의 시스템에서 OpenShift Container Platform을 제거하려면 운영 체제를 제거해야하므로 클러스터에 추가한 모든 RHEL 머신에 전용 하드웨어를 사용해야합니다.
- OpenShift Container Platform 클러스터에 추가한 모든 RHEL 머신에서 스왑 메모리가 비활성화됩니다. 이 머신에서 스왑 메모리를 활성화할 수 없습니다.
10.2. RHEL 컴퓨팅 노드의 시스템 요구 사항
OpenShift Container Platform 환경의 RHEL (Red Hat Enterprise Linux) 컴퓨팅 머신 호스트는 다음과 같은 최소 하드웨어 사양 및 시스템 수준 요구 사항을 충족해야합니다.
- Red Hat 계정에 유효한 OpenShift Container Platform 서브스크립션이 있어야합니다. 서브스크립션이 없는 경우 영업 담당자에게 자세한 내용을 문의하십시오.
- 프로덕션 환경에서 예상 워크로드를 지원할 수 있는 컴퓨팅 머신을 제공해야합니다. 클러스터 관리자는 예상 워크로드를 계산하고 오버 헤드에 약 10%를 추가해야합니다. 프로덕션 환경의 경우 노드 호스트 장애가 최대 용량에 영향을 미치지 않도록 충분한 리소스를 할당해야 합니다.
각 시스템은 다음 하드웨어 요구 사항을 충족해야합니다.
- 물리적 또는 가상 시스템 또는 퍼블릭 또는 프라이빗 IaaS에서 실행되는 인스턴스.
기본 OS: RHEL 8.6 이상, "최소" 설치 옵션이 있습니다.
중요OpenShift Container Platform 클러스터에 RHEL 7 컴퓨팅 머신을 추가하는 것은 지원되지 않습니다.
이전에 OpenShift Container Platform 버전에서 지원되는 RHEL 7 컴퓨팅 머신이 있는 경우 RHEL 8로 업그레이드할 수 없습니다. 새 RHEL 8 호스트를 배포해야 하며 이전 RHEL 7 호스트를 제거해야 합니다. 자세한 내용은 "노드 삭제" 섹션을 참조하십시오.
OpenShift Container Platform에서 더 이상 사용되지 않거나 삭제된 주요 기능의 최신 목록은 OpenShift Container Platform 릴리스 노트에서 더 이상 사용되지 않고 삭제된 기능 섹션을 참조하십시오.
- NetworkManager 1.0 이상
- vCPU 1개
- 최소 8GB RAM
-
/var/
를 포함하는 파일 시스템의 최소 15GB 하드 디스크 공간 -
/usr/local/bin/
을 포함하는 파일 시스템의 최소 1GB 하드 디스크 공간 임시 디렉토리를 포함하는 파일 시스템의 최소 1GB의 하드 디스크 공간 임시 시스템 디렉토리는 Python 표준 라이브러리의 tempfile 모듈에 정의된 규칙에 따라 결정됩니다.
-
각 시스템은 시스템 제공 업체의 추가 요구 사항을 충족해야합니다. 예를 들어 VMware vSphere에 클러스터를 설치하는 경우 스토리지 지침에 따라 디스크를 구성하고
disk.enableUUID=true
속성을 설정해야합니다. - 각 시스템은 DNS 확인 가능한 호스트 이름을 사용하여 클러스터의 API 끝점에 액세스할 수 있어야 합니다. 모든 네트워크 보안 액세스 제어는 클러스터의 API 서비스 엔드 포인트에 대한 시스템 액세스를 허용해야합니다.
-
각 시스템은 시스템 제공 업체의 추가 요구 사항을 충족해야합니다. 예를 들어 VMware vSphere에 클러스터를 설치하는 경우 스토리지 지침에 따라 디스크를 구성하고
추가 리소스
10.2.1. 인증서 서명 요청 관리
사용자가 프로비저닝하는 인프라를 사용하는 경우 자동 시스템 관리 기능으로 인해 클러스터의 액세스가 제한되므로 설치한 후 클러스터 인증서 서명 요청(CSR)을 승인하는 메커니즘을 제공해야 합니다. kube-controller-manager
는 kubelet 클라이언트 CSR만 승인합니다. machine-approver
는 올바른 시스템에서 발행한 요청인지 확인할 수 없기 때문에 kubelet 자격 증명을 사용하여 요청하는 서비스 인증서의 유효성을 보장할 수 없습니다. kubelet 서빙 인증서 요청의 유효성을 확인하고 요청을 승인하는 방법을 결정하여 구현해야 합니다.
10.3. 클라우드 이미지 준비
AWS에서 다양한 이미지 형식을 직접 사용할 수 없기 때문에 Amazon 머신 이미지(AMI)가 필요합니다. Red Hat에서 제공하는 AMI를 사용하거나 자체 이미지를 수동으로 가져올 수 있습니다. EC2 인스턴스를 프로비저닝하기 전에 AMI가 있어야 합니다. 컴퓨팅 시스템에 필요한 올바른 RHEL 버전이 선택되도록 AMI ID를 나열해야 합니다.
10.3.1. AWS에서 사용 가능한 최신 RHEL 이미지 나열
AMI ID는 AWS의 기본 부팅 이미지에 해당합니다. AMI는 EC2 인스턴스를 프로비저닝하기 전에 존재해야 하므로 구성 전에 AMI ID를 알아야 합니다. AWS CLI(Command Line Interface)는 사용 가능한 RHEL(Red Hat Enterprise Linux) 이미지 ID를 나열하는 데 사용됩니다.
사전 요구 사항
- AWS CLI를 설치했습니다.
프로세스
이 명령을 사용하여 RHEL 8.4 AMI(Amazon Machine Images)를 나열합니다.
$ aws ec2 describe-images --owners 309956199498 \ 1 --query 'sort_by(Images, &CreationDate)[*].[CreationDate,Name,ImageId]' \ 2 --filters "Name=name,Values=RHEL-8.4*" \ 3 --region us-east-1 \ 4 --output table 5
- 1
--owners
명령 옵션은 계정 ID309956199498
에 기반한 Red Hat 이미지를 보여줍니다.중요Red Hat에서 제공하는 이미지의 AMI ID를 표시하려면 이 계정 ID가 필요합니다.
- 2
--query
명령 옵션은'sort_by(Images, &CreationDate)[*].[CreationDate,Name,ImageId]
매개변수로 이미지가 정렬되는 방법을 설정합니다. 이 경우 이미지는 생성 날짜에 따라 정렬되며 테이블은 생성 날짜, 이미지 이름 및 AMI ID를 표시하도록 구성됩니다.- 3
--filter
명령 옵션은 표시되는 RHEL 버전을 설정합니다. 이 예에서는 필터가"Name=name,Values=RHEL-8.4*"
로 설정되므로 RHEL 8.4 AMI가 표시됩니다.- 4
--region
명령 옵션은 AMI가 저장된 리전을 설정합니다.- 5
--output
명령 옵션은 결과가 표시되는 방법을 설정합니다.
AWS용 RHEL 컴퓨팅 머신을 생성할 때 AMI가 RHEL 8.4 또는 8.5인지 확인합니다.
출력 예
------------------------------------------------------------------------------------------------------------ | DescribeImages | +---------------------------+-----------------------------------------------------+------------------------+ | 2021-03-18T14:23:11.000Z | RHEL-8.4.0_HVM_BETA-20210309-x86_64-1-Hourly2-GP2 | ami-07eeb4db5f7e5a8fb | | 2021-03-18T14:38:28.000Z | RHEL-8.4.0_HVM_BETA-20210309-arm64-1-Hourly2-GP2 | ami-069d22ec49577d4bf | | 2021-05-18T19:06:34.000Z | RHEL-8.4.0_HVM-20210504-arm64-2-Hourly2-GP2 | ami-01fc429821bf1f4b4 | | 2021-05-18T20:09:47.000Z | RHEL-8.4.0_HVM-20210504-x86_64-2-Hourly2-GP2 | ami-0b0af3577fe5e3532 | +---------------------------+-----------------------------------------------------+------------------------+
10.4. RHEL 컴퓨팅 노드 준비
RHEL (Red Hat Enterprise Linux) 시스템을 OpenShift Container Platform 클러스터에 추가하기 전에 각 호스트를 RHSM (Red Hat Subscription Manager)에 등록하고 활성 OpenShift Container Platform 서브스크립션을 연결하고 필요한 저장소를 활성화해야합니다.
각 호스트에서 RHSM으로 동륵합니다.
# subscription-manager register --username=<user_name> --password=<password>
RHSM에서 최신 서브스크립션 데이터를 가져옵니다.
# subscription-manager refresh
사용 가능한 서브스크립션을 나열하십시오.
# subscription-manager list --available --matches '*OpenShift*'
이전 명령의 출력에서 OpenShift Container Platform 서브스크립션의 풀 ID를 찾아서 이를 연결합니다.
# subscription-manager attach --pool=<pool_id>
모든 yum 저장소를 비활성화합니다.
활성화된 모든 RHSM 저장소를 비활성화합니다.
# subscription-manager repos --disable="*"
나머지 yum 저장소를 나열하고
repo id
아래에 해당 이름을 적어 둡니다.# yum repolist
yum-config-manager
를 사용하여 나머지 yum 리포지토리를 비활성화합니다.# yum-config-manager --disable <repo_id>
또는 모든 리포지토리를 비활성화합니다.
# yum-config-manager --disable \*
사용 가능한 리포지토리가 많으면 몇 분의 시간이 소요될 수 있습니다.
OpenShift Container Platform 4.13에 필요한 리포지토리를 활성화합니다.
# subscription-manager repos \ --enable="rhel-8-for-x86_64-baseos-rpms" \ --enable="rhel-8-for-x86_64-appstream-rpms" \ --enable="rhocp-4.13-for-rhel-8-x86_64-rpms" \ --enable="fast-datapath-for-rhel-8-x86_64-rpms"
호스트에서 firewalld를 중지하고 비활성화합니다.
# systemctl disable --now firewalld.service
참고나중에 firewalld를 활성화할 수 없습니다. 활성화하면 작업자의 OpenShift Container Platform 로그에 액세스할 수 없습니다.
10.5. AWS의 RHEL 인스턴스에 역할 권한 연결
브라우저에서 Amazon IAM 콘솔을 사용하여 필요한 역할을 선택하고 작업자 노드에 할당할 수 있습니다.
프로세스
- AWS IAM 콘솔에서 원하는 IAM 역할을 생성합니다.
- 원하는 작업자 노드에 IAM 역할을 연결합니다.
추가 리소스
- IAM 역할에 대한 필수 AWS 권한을 참조하십시오.
10.6. RHEL 작업자 노드를 owned 또는 shared로 태그 지정
클러스터는 kubernetes.io/cluster/<clusterid>,Value=(owned|shared)
태그 값을 사용하여 AWS 클러스터와 관련된 리소스의 수명을 결정합니다.
-
클러스터 제거의 일부로 리소스를 제거해야 하는 경우
owned
태그 값을 추가해야 합니다. -
클러스터가 제거된 후에도 리소스가 계속 존재하는 경우
shared
태그 값을 추가해야 합니다. 이 태그는 클러스터가 이 리소스를 사용하지만 리소스에 대해 별도의 소유자가 있음을 나타냅니다.
프로세스
-
RHEL 컴퓨팅 머신의 경우 RHEL 작업자 인스턴스는
kubernetes.io/cluster/<clusterid>=owned
또는kubernetes.io/cluster/<cluster-id>=shared
로 태그 지정해야 합니다.
kubernetes.io/cluster/<name>,Value=<clusterid>
태그로 기존 보안 그룹을 태그하지 마십시오. 그렇지 않으면 ELB(Elastic Load Balancing)에서 로드 밸런서를 생성할 수 없습니다.
10.7. 클러스터에 더 많은 RHEL 컴퓨팅 시스템 업데이트 추가
Red Hat Enterprise Linux (RHEL)를 운영 체제로 사용하는 컴퓨팅 머신을 OpenShift Container Platform 4.13 클러스터에 추가할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터에는 이미 RHEL 컴퓨팅 노드가 포함되어 있습니다.
-
첫 번째 RHEL 컴퓨팅 머신을 클러스터에 추가하는 데 사용한
hosts
파일은 Playbook을 실행하는 머신에 있습니다. - Playbook을 실행하는 컴퓨터는 모든 RHEL 호스트에 액세스할 수 있어야합니다. SSH 프록시 또는 VPN을 사용하는 Bastion를 포함하여 회사에서 허용하는 모든 방법을 사용할 수 있습니다.
-
클러스터의
kubeconfig
파일 및 클러스터를 설치에 사용된 설치 프로그램은 Playbook을 실행하는 머신에 있습니다. - 설치를 위해 RHEL 호스트를 준비해야합니다.
- Playbook을 실행하는 머신에서 모든 RHEL 호스트에 대한 SSH 액세스 권한이있는 사용자를 구성하십시오.
- SSH 키 기반 인증을 사용하는 경우 SSH 에이전트를 사용하여 키를 관리해야합니다.
-
Playbook을 실행하는 머신에 OpenShift CLI (
oc
)를 설치합니다.
프로세스
-
컴퓨팅 시스템 호스트 및 필수 변수를 정의하는
/<path>/inventory/hosts
에서 Ansible 인벤토리 파일을 엽니 다. -
파일의
[new_workers]
섹션 이름을[workers]
로 변경합니다. [new_workers]
섹션을 파일에 추가하고 각각의 새 호스트의 정규화된 도메인 이름을 정의합니다. 파일은 다음 예제와 유사합니다.[all:vars] ansible_user=root #ansible_become=True openshift_kubeconfig_path="~/.kube/config" [workers] mycluster-rhel8-0.example.com mycluster-rhel8-1.example.com [new_workers] mycluster-rhel8-2.example.com mycluster-rhel8-3.example.com
이 예에서
mycluster-rhel8-0.example.com
및mycluster-rhel8-1.example.com
시스템은 클러스터에 있으며mycluster-rhel8-2.example.com
및mycluster-rhel8-3.example.com
시스템을 추가합니다.Ansible Playbook 디렉토리로 이동합니다.
$ cd /usr/share/ansible/openshift-ansible
스케일 업 Playbook을 실행합니다.
$ ansible-playbook -i /<path>/inventory/hosts playbooks/scaleup.yml 1
- 1
<path>
에 대해 생성한 Ansible 인벤토리 파일의 경로를 지정합니다.
10.8. 시스템의 인증서 서명 요청 승인
클러스터에 시스템을 추가하면 추가한 시스템별로 보류 중인 인증서 서명 요청(CSR)이 두 개씩 생성됩니다. 이러한 CSR이 승인되었는지 확인해야 하며, 필요한 경우 이를 직접 승인해야 합니다. 클라이언트 요청을 먼저 승인한 다음 서버 요청을 승인해야 합니다.
사전 요구 사항
- 클러스터에 시스템을 추가했습니다.
프로세스
클러스터가 시스템을 인식하는지 확인합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 63m v1.26.0 master-1 Ready master 63m v1.26.0 master-2 Ready master 64m v1.26.0
출력에 생성된 모든 시스템이 나열됩니다.
참고이전 출력에는 일부 CSR이 승인될 때까지 컴퓨팅 노드(작업자 노드라고도 함)가 포함되지 않을 수 있습니다.
보류 중인 CSR을 검토하고 클러스터에 추가한 각 시스템에 대해
Pending
또는Approved
상태의 클라이언트 및 서버 요청이 표시되는지 확인합니다.$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-8b2br 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending csr-8vnps 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending ...
예에서는 두 시스템이 클러스터에 참여하고 있습니다. 목록에는 승인된 CSR이 더 많이 나타날 수도 있습니다.
CSR이 승인되지 않은 경우, 추가된 시스템에 대한 모든 보류 중인 CSR이
Pending
상태로 전환된 후 클러스터 시스템의 CSR을 승인합니다.참고CSR은 교체 주기가 자동으로 만료되므로 클러스터에 시스템을 추가한 후 1시간 이내에 CSR을 승인하십시오. 한 시간 내에 승인하지 않으면 인증서가 교체되고 각 노드에 대해 두 개 이상의 인증서가 표시됩니다. 이러한 인증서를 모두 승인해야 합니다. 클라이언트 CSR이 승인되면 Kubelet은 인증서에 대한 보조 CSR을 생성하므로 수동 승인이 필요합니다. 그러면 Kubelet에서 동일한 매개변수를 사용하여 새 인증서를 요청하는 경우 인증서 갱신 요청은
machine-approver
에 의해 자동으로 승인됩니다.참고베어 메탈 및 기타 사용자 프로비저닝 인프라와 같이 머신 API를 사용하도록 활성화되지 않는 플랫폼에서 실행되는 클러스터의 경우 CSR(Kubelet service Certificate Request)을 자동으로 승인하는 방법을 구현해야 합니다. 요청이 승인되지 않으면 API 서버가 kubelet에 연결될 때 서비스 인증서가 필요하므로
oc exec
,oc rsh
,oc logs
명령을 성공적으로 수행할 수 없습니다. Kubelet 엔드 포인트에 연결하는 모든 작업을 수행하려면 이 인증서 승인이 필요합니다. 이 방법은 새 CSR을 감시하고 CSR이system:node
또는system:admin
그룹의node-bootstrapper
서비스 계정에 의해 제출되었는지 확인하고 노드의 ID를 확인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs --no-run-if-empty oc adm certificate approve
참고일부 Operator는 일부 CSR이 승인될 때까지 사용할 수 없습니다.
이제 클라이언트 요청이 승인되었으므로 클러스터에 추가한 각 머신의 서버 요청을 검토해야 합니다.
$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-bfd72 5m26s system:node:ip-10-0-50-126.us-east-2.compute.internal Pending csr-c57lv 5m26s system:node:ip-10-0-95-157.us-east-2.compute.internal Pending ...
나머지 CSR이 승인되지 않고
Pending
상태인 경우 클러스터 머신의 CSR을 승인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs oc adm certificate approve
모든 클라이언트 및 서버 CSR이 승인된 후 머신은
Ready
상태가 됩니다. 다음 명령을 실행하여 확인합니다.$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 73m v1.26.0 master-1 Ready master 73m v1.26.0 master-2 Ready master 74m v1.26.0 worker-0 Ready worker 11m v1.26.0 worker-1 Ready worker 11m v1.26.0
참고머신이
Ready
상태로 전환하는 데 서버 CSR의 승인 후 몇 분이 걸릴 수 있습니다.
추가 정보
- CSR에 대한 자세한 내용은 인증서 서명 요청을 참조하십시오.
10.9. Ansible 호스트 파일의 필수 매개 변수
RHEL (Red Hat Enterprise Linux) 컴퓨팅 머신을 클러스터에 추가하기 전에 Ansible 호스트 파일에서 다음 매개 변수를 정의해야합니다.
매개변수 | 설명 | 값 |
---|---|---|
| 암호없이 SSH 기반 인증을 허용하는 SSH 사용자입니다. SSH 키 기반 인증을 사용하는 경우 SSH 에이전트를 사용하여 키를 관리해야합니다. |
시스템의 사용자 이름입니다. 기본값은 |
|
|
|
|
클러스터의 | 구성 파일의 경로 및 이름 |
11장. 수동으로 사용자 프로비저닝 인프라 관리
11.1. 사용자 프로비저닝 인프라가 있는 클러스터에 수동으로 컴퓨팅 머신 추가
설치 프로세스의 일부 또는 설치 후 사용자 프로비저닝 인프라의 클러스터에 컴퓨팅 머신을 추가할 수 있습니다. 설치 후 프로세스에는 설치 중에 사용된 것과 동일한 구성 파일과 매개 변수 중 일부가 필요합니다.
11.1.1. Amazon Web Services에 컴퓨팅 머신 추가
AWS(Amazon Web Services)의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 CloudFormation 템플릿을 사용하여 AWS에 컴퓨팅 머신 추가 를 참조하십시오.
11.1.2. Microsoft Azure에 컴퓨팅 머신 추가
Microsoft Azure의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 Azure에서 추가 작업자 머신 생성 을 참조하십시오.
11.1.3. Azure Stack Hub에 컴퓨팅 머신 추가
Azure Stack Hub의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 Azure Stack Hub 에서 추가 작업자 머신 생성 을 참조하십시오.
11.1.4. Google Cloud Platform에 컴퓨팅 머신 추가
GCP(Google Cloud Platform)의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 GCP에서 추가 작업자 머신 생성 을 참조하십시오.
11.1.5. vSphere에 컴퓨팅 머신 추가
컴퓨팅 머신 세트를 사용하여 vSphere에서 OpenShift Container Platform 클러스터에 대한 추가 컴퓨팅 머신 생성을 자동화할 수 있습니다.
클러스터에 컴퓨팅 머신을 수동으로 추가하려면 vSphere에 컴퓨팅 머신 추가를 참조하십시오.
11.1.6. RHV에 컴퓨팅 시스템 추가
RHV의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 RHV에 컴퓨팅 머신 추가를 참조하십시오.
11.1.7. 베어 메탈에 컴퓨팅 머신 추가
베어 메탈의 OpenShift Container Platform 클러스터에 컴퓨팅 머신을 추가하려면 베어 메탈에 컴퓨팅 머신 추가를 참조하십시오.
11.2. CloudFormation 템플릿을 사용하여 AWS에 컴퓨팅 머신 추가
샘플 CloudFormation 템플릿을 사용하여 생성한 AWS(Amazon Web Services)의 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다.
11.2.1. 사전 요구 사항
- 제공된 AWS CloudFormation 템플릿을 사용하여 AWS에 클러스터가 설치되어 있어야 합니다.
- 클러스터 설치 중에 컴퓨팅 시스템을 생성하는 데 사용한 JSON 파일 및 CloudFormation 템플릿이 있습니다. 이러한 파일이 없는 경우 설치 절차에 따라 파일을 다시 생성해야 합니다.
11.2.2. CloudFormation 템플릿을 사용하여 AWS 클러스터에 추가
샘플 CloudFormation 템플릿을 사용하여 생성한 AWS(Amazon Web Services)의 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다.
CloudFormation 템플릿은 하나의 컴퓨팅 시스템을 나타내는 스택을 생성합니다. 각 컴퓨팅 시스템의 스택을 생성해야 합니다.
컴퓨팅 노드를 생성하는 데 제공된 CloudFormation 템플릿을 사용하지 않는 경우, 제공된 정보를 검토하고 수동으로 인프라를 생성해야 합니다.. 클러스터가 올바르게 초기화되지 않은 경우, Red Hat 지원팀에 설치 로그를 제시하여 문의해야 할 수도 있습니다.
사전 요구 사항
- CloudFormation 템플릿을 사용하여 OpenShift Container Platform 클러스터를 설치하고 클러스터 설치 중에 컴퓨팅 시스템을 생성하는 데 사용한 JSON 파일 및 CloudFormation 템플릿에 액세스할 수 있습니다.
- AWS CLI를 설치했습니다.
절차
다른 컴퓨팅 스택을 생성합니다.
템플릿을 시작합니다.
$ aws cloudformation create-stack --stack-name <name> \ 1 --template-body file://<template>.yaml \ 2 --parameters file://<parameters>.json 3
템플릿 구성 요소가 있는지 확인합니다.
$ aws cloudformation describe-stacks --stack-name <name>
- 클러스터에 충분한 컴퓨팅 시스템을 생성할 때까지 계속해서 컴퓨팅 스택을 생성합니다.
11.2.3. 시스템의 인증서 서명 요청 승인
클러스터에 시스템을 추가하면 추가한 시스템별로 보류 중인 인증서 서명 요청(CSR)이 두 개씩 생성됩니다. 이러한 CSR이 승인되었는지 확인해야 하며, 필요한 경우 이를 직접 승인해야 합니다. 클라이언트 요청을 먼저 승인한 다음 서버 요청을 승인해야 합니다.
사전 요구 사항
- 클러스터에 시스템을 추가했습니다.
절차
클러스터가 시스템을 인식하는지 확인합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 63m v1.26.0 master-1 Ready master 63m v1.26.0 master-2 Ready master 64m v1.26.0
출력에 생성된 모든 시스템이 나열됩니다.
참고이전 출력에는 일부 CSR이 승인될 때까지 컴퓨팅 노드(작업자 노드라고도 함)가 포함되지 않을 수 있습니다.
보류 중인 CSR을 검토하고 클러스터에 추가한 각 시스템에 대해
Pending
또는Approved
상태의 클라이언트 및 서버 요청이 표시되는지 확인합니다.$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-8b2br 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending csr-8vnps 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending ...
예에서는 두 시스템이 클러스터에 참여하고 있습니다. 목록에는 승인된 CSR이 더 많이 나타날 수도 있습니다.
CSR이 승인되지 않은 경우, 추가된 시스템에 대한 모든 보류 중인 CSR이
Pending
상태로 전환된 후 클러스터 시스템의 CSR을 승인합니다.참고CSR은 교체 주기가 자동으로 만료되므로 클러스터에 시스템을 추가한 후 1시간 이내에 CSR을 승인하십시오. 한 시간 내에 승인하지 않으면 인증서가 교체되고 각 노드에 대해 두 개 이상의 인증서가 표시됩니다. 이러한 인증서를 모두 승인해야 합니다. 클라이언트 CSR이 승인되면 Kubelet은 인증서에 대한 보조 CSR을 생성하므로 수동 승인이 필요합니다. 그러면 Kubelet에서 동일한 매개변수를 사용하여 새 인증서를 요청하는 경우 인증서 갱신 요청은
machine-approver
에 의해 자동으로 승인됩니다.참고베어 메탈 및 기타 사용자 프로비저닝 인프라와 같이 머신 API를 사용하도록 활성화되지 않는 플랫폼에서 실행되는 클러스터의 경우 CSR(Kubelet service Certificate Request)을 자동으로 승인하는 방법을 구현해야 합니다. 요청이 승인되지 않으면 API 서버가 kubelet에 연결될 때 서비스 인증서가 필요하므로
oc exec
,oc rsh
,oc logs
명령을 성공적으로 수행할 수 없습니다. Kubelet 엔드 포인트에 연결하는 모든 작업을 수행하려면 이 인증서 승인이 필요합니다. 이 방법은 새 CSR을 감시하고 CSR이system:node
또는system:admin
그룹의node-bootstrapper
서비스 계정에 의해 제출되었는지 확인하고 노드의 ID를 확인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs --no-run-if-empty oc adm certificate approve
참고일부 Operator는 일부 CSR이 승인될 때까지 사용할 수 없습니다.
이제 클라이언트 요청이 승인되었으므로 클러스터에 추가한 각 머신의 서버 요청을 검토해야 합니다.
$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-bfd72 5m26s system:node:ip-10-0-50-126.us-east-2.compute.internal Pending csr-c57lv 5m26s system:node:ip-10-0-95-157.us-east-2.compute.internal Pending ...
나머지 CSR이 승인되지 않고
Pending
상태인 경우 클러스터 머신의 CSR을 승인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs oc adm certificate approve
모든 클라이언트 및 서버 CSR이 승인된 후 머신은
Ready
상태가 됩니다. 다음 명령을 실행하여 확인합니다.$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 73m v1.26.0 master-1 Ready master 73m v1.26.0 master-2 Ready master 74m v1.26.0 worker-0 Ready worker 11m v1.26.0 worker-1 Ready worker 11m v1.26.0
참고머신이
Ready
상태로 전환하는 데 서버 CSR의 승인 후 몇 분이 걸릴 수 있습니다.
추가 정보
- CSR에 대한 자세한 내용은 인증서 서명 요청을 참조하십시오.
11.3. vSphere에 수동으로 컴퓨팅 머신 추가
VMware vSphere의 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 수동으로 추가할 수 있습니다.
컴퓨팅 머신 세트를 사용하여 클러스터에 대한 추가 VMware vSphere 컴퓨팅 머신 생성을 자동화할 수도 있습니다.
11.3.1. 사전 요구 사항
- vSphere에 클러스터가 설치되어 있어야 합니다.
- 클러스터를 만드는 데 사용한 설치 미디어 및 Red Hat Enterprise Linux CoreOS (RHCOS) 이미지가 있습니다. 이러한 파일이 없는 경우 설치 절차에 따라 파일을 가져와야 합니다.
클러스터를 생성하는 데 사용되는 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지에 액세스할 수 없는 경우 최신 버전의 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지를 사용하여 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다. 자세한 내용은 OpenShift 4.6+로 업그레이드한 후 UPI 클러스터에 새 노드 추가 실패를 참조하십시오.
11.3.2. vSphere의 클러스터에 더 많은 컴퓨팅 머신 추가
VMware vSphere에서 사용자가 프로비저닝한 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다.
vSphere 템플릿이 OpenShift Container Platform 클러스터에 배포된 후 해당 클러스터의 머신용 VM(가상 머신)을 배포할 수 있습니다.
사전 요구 사항
- 컴퓨팅 머신의 base64로 인코딩된 Ignition 파일을 가져옵니다.
- 클러스터에 생성한 vSphere 템플릿에 액세스할 수 있습니다.
절차
- 템플릿 이름을 마우스 오른쪽 버튼으로 클릭하고 Clone → Clone to Virtual Machine을 클릭합니다.
Select a name and folder 탭에서 가상 머신의 이름을 지정합니다.
compute-1
과 같은 머신 유형을 이름에 포함할 수 있습니다.참고vSphere 설치의 모든 가상 머신 이름이 고유한지 확인합니다.
- Select a name and folder 탭에서 클러스터에 대해 생성한 폴더의 이름을 선택합니다.
- Select a compute resource 탭에서 데이터 센터의 호스트 이름을 선택합니다.
- Select storage 탭에서 구성 및 디스크 파일에 대한 스토리지를 선택합니다.
- Select clone options 탭에서 Customize this virtual machine's hardware 를 선택합니다.
Customize hardware 탭에서 Advanced Parameters 를 클릭합니다.
Attribute 및 Values 필드에 데이터를 지정하여 다음 구성 매개 변수 이름 및 값을 추가합니다. 생성한 각 매개변수에 대한 추가 버튼을 선택해야 합니다.
-
guestinfo.ignition.config.data
: 이 머신 유형에 대해 base64로 인코딩된 컴퓨팅 Ignition 구성 파일의 내용을 붙여넣습니다. -
guestinfo.ignition.config.data.encoding
:base64
를 지정합니다. -
disk.EnableUUID
:TRUE
를 지정합니다.
-
- Customize hardware 탭의 Virtual Hardware 패널에서 지정된 값을 필요에 따라 수정합니다. RAM, CPU 및 디스크 스토리지의 양이 시스템 유형에 대한 최소 요구사항을 충족하는지 확인합니다. 많은 네트워크가 있는 경우 새 장치 > 네트워크 어댑터 추가 를 선택한 다음 새 네트워크 메뉴 항목에서 제공하는 필드에 네트워크 정보를 입력합니다.
- 나머지 구성 단계를 완료합니다. 완료 버튼을 클릭하면 복제 작업을 완료했습니다.
- 가상 머신 탭에서 VM을 마우스 오른쪽 버튼으로 클릭한 다음 Power → Power On 을 선택합니다.
다음 단계
- 계속해서 클러스터에 추가 컴퓨팅 머신을 만듭니다.
11.3.3. 시스템의 인증서 서명 요청 승인
클러스터에 시스템을 추가하면 추가한 시스템별로 보류 중인 인증서 서명 요청(CSR)이 두 개씩 생성됩니다. 이러한 CSR이 승인되었는지 확인해야 하며, 필요한 경우 이를 직접 승인해야 합니다. 클라이언트 요청을 먼저 승인한 다음 서버 요청을 승인해야 합니다.
사전 요구 사항
- 클러스터에 시스템을 추가했습니다.
절차
클러스터가 시스템을 인식하는지 확인합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 63m v1.26.0 master-1 Ready master 63m v1.26.0 master-2 Ready master 64m v1.26.0
출력에 생성된 모든 시스템이 나열됩니다.
참고이전 출력에는 일부 CSR이 승인될 때까지 컴퓨팅 노드(작업자 노드라고도 함)가 포함되지 않을 수 있습니다.
보류 중인 CSR을 검토하고 클러스터에 추가한 각 시스템에 대해
Pending
또는Approved
상태의 클라이언트 및 서버 요청이 표시되는지 확인합니다.$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-8b2br 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending csr-8vnps 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending ...
예에서는 두 시스템이 클러스터에 참여하고 있습니다. 목록에는 승인된 CSR이 더 많이 나타날 수도 있습니다.
CSR이 승인되지 않은 경우, 추가된 시스템에 대한 모든 보류 중인 CSR이
Pending
상태로 전환된 후 클러스터 시스템의 CSR을 승인합니다.참고CSR은 교체 주기가 자동으로 만료되므로 클러스터에 시스템을 추가한 후 1시간 이내에 CSR을 승인하십시오. 한 시간 내에 승인하지 않으면 인증서가 교체되고 각 노드에 대해 두 개 이상의 인증서가 표시됩니다. 이러한 인증서를 모두 승인해야 합니다. 클라이언트 CSR이 승인되면 Kubelet은 인증서에 대한 보조 CSR을 생성하므로 수동 승인이 필요합니다. 그러면 Kubelet에서 동일한 매개변수를 사용하여 새 인증서를 요청하는 경우 인증서 갱신 요청은
machine-approver
에 의해 자동으로 승인됩니다.참고베어 메탈 및 기타 사용자 프로비저닝 인프라와 같이 머신 API를 사용하도록 활성화되지 않는 플랫폼에서 실행되는 클러스터의 경우 CSR(Kubelet service Certificate Request)을 자동으로 승인하는 방법을 구현해야 합니다. 요청이 승인되지 않으면 API 서버가 kubelet에 연결될 때 서비스 인증서가 필요하므로
oc exec
,oc rsh
,oc logs
명령을 성공적으로 수행할 수 없습니다. Kubelet 엔드 포인트에 연결하는 모든 작업을 수행하려면 이 인증서 승인이 필요합니다. 이 방법은 새 CSR을 감시하고 CSR이system:node
또는system:admin
그룹의node-bootstrapper
서비스 계정에 의해 제출되었는지 확인하고 노드의 ID를 확인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs --no-run-if-empty oc adm certificate approve
참고일부 Operator는 일부 CSR이 승인될 때까지 사용할 수 없습니다.
이제 클라이언트 요청이 승인되었으므로 클러스터에 추가한 각 머신의 서버 요청을 검토해야 합니다.
$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-bfd72 5m26s system:node:ip-10-0-50-126.us-east-2.compute.internal Pending csr-c57lv 5m26s system:node:ip-10-0-95-157.us-east-2.compute.internal Pending ...
나머지 CSR이 승인되지 않고
Pending
상태인 경우 클러스터 머신의 CSR을 승인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs oc adm certificate approve
모든 클라이언트 및 서버 CSR이 승인된 후 머신은
Ready
상태가 됩니다. 다음 명령을 실행하여 확인합니다.$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 73m v1.26.0 master-1 Ready master 73m v1.26.0 master-2 Ready master 74m v1.26.0 worker-0 Ready worker 11m v1.26.0 worker-1 Ready worker 11m v1.26.0
참고머신이
Ready
상태로 전환하는 데 서버 CSR의 승인 후 몇 분이 걸릴 수 있습니다.
추가 정보
- CSR에 대한 자세한 내용은 인증서 서명 요청을 참조하십시오.
11.4. RHV의 클러스터에 컴퓨팅 시스템 추가
OpenShift Container Platform 버전 4.13에서는 RHV의 사용자가 프로비저닝한 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다.
사전 요구 사항
- 사용자 프로비저닝 인프라를 사용하여 RHV에 클러스터가 설치되어 있어야 합니다.
11.4.1. RHV의 클러스터에 더 많은 컴퓨팅 시스템 추가
절차
-
새 작업자를 포함하도록
inventory.yml
파일을 수정합니다. create-templates-and-vms
Ansible 플레이북을 실행하여 디스크 및 가상 머신을 생성합니다.$ ansible-playbook -i inventory.yml create-templates-and-vms.yml
workers.yml
Ansible 플레이북을 실행하여 가상 머신을 시작합니다.$ ansible-playbook -i inventory.yml workers.yml
클러스터에 가입하는 새 작업자의 CSR은 관리자가 승인해야 합니다. 다음 명령은 보류 중인 모든 요청을 승인하는 데 도움이 됩니다.
$ oc get csr -ojson | jq -r '.items[] | select(.status == {} ) | .metadata.name' | xargs oc adm certificate approve
11.5. 베어 메탈에 컴퓨팅 머신 추가
베어 메탈의 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다.
11.5.1. 사전 요구 사항
- 베어 메탈에 클러스터가 설치되어 있어야 합니다.
- 클러스터를 만드는 데 사용한 설치 미디어 및 Red Hat Enterprise Linux CoreOS (RHCOS) 이미지가 있습니다. 이러한 파일이 없는 경우 설치 절차에 따라 파일을 가져와야 합니다.
- 사용자 프로비저닝 인프라에 DHCP 서버를 사용할 수 있는 경우 추가 컴퓨팅 머신의 세부 정보를 DHCP 서버 구성에 추가했습니다. 여기에는 영구 IP 주소, DNS 서버 정보 및 각 시스템의 호스트 이름이 포함됩니다.
- 추가하려는 각 컴퓨팅 시스템의 레코드 이름 및 IP 주소를 포함하도록 DNS 구성을 업데이트했습니다. DNS 조회 및 역방향 DNS 조회가 올바르게 확인되었는지 확인했습니다.
클러스터를 생성하는 데 사용되는 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지에 액세스할 수 없는 경우 최신 버전의 RHCOS(Red Hat Enterprise Linux CoreOS) 이미지를 사용하여 OpenShift Container Platform 클러스터에 더 많은 컴퓨팅 머신을 추가할 수 있습니다. 자세한 내용은 OpenShift 4.6+로 업그레이드한 후 UPI 클러스터에 새 노드 추가 실패를 참조하십시오.
11.5.2. RHCOS(Red Hat Enterprise Linux CoreOS) 시스템 생성
베어메탈 인프라에 설치된 클러스터에 컴퓨팅 머신을 추가하기 전에 사용할 RHCOS 머신을 생성해야 합니다. ISO 이미지 또는 네트워크 PXE 부팅을 사용하여 시스템을 생성합니다.
클러스터의 모든 새 노드를 배포하기 위해 클러스터를 설치하는 데 사용한 것과 동일한 ISO 이미지를 사용해야 합니다. 동일한 Ignition 구성 파일을 사용하는 것이 좋습니다. 워크로드를 실행하기 전에 노드는 첫 번째 부팅에서 자동으로 업그레이드됩니다. 업그레이드 전이나 후에 노드를 추가할 수 있습니다.
11.5.2.1. ISO 이미지를 사용하여 RHCOS 머신 생성
ISO 이미지를 사용하여 머신을 생성함으로써 베어 메탈 클러스터에 대해 더 많은 Red Hat Enterprise Linux CoreOS (RHCOS) 컴퓨팅 머신을 생성할 수 있습니다.
사전 요구 사항
- 클러스터의 컴퓨팅 머신에 대한 Ignition 구성 파일의 URL을 가져옵니다. 설치 중에 이 파일은 HTTP 서버에 업로드되어 있어야 합니다.
-
OpenShift CLI(
oc
)가 설치되어 있어야 합니다.
절차
다음 명령을 실행하여 클러스터에서 Ignition 구성 파일을 추출합니다.
$ oc extract -n openshift-machine-api secret/worker-user-data-managed --keys=userData --to=- > worker.ign
-
내보낸
worker.ign
Ignition 구성 파일을 클러스터에서 HTTP 서버로 업로드합니다. 해당 파일의 URL을 기록해 둡니다. URL에서 Ignition 파일을 사용할 수 있는지 확인할 수 있습니다. 다음 예제에서는 컴퓨팅 노드에 대한 Ignition 구성 파일을 가져옵니다.
$ curl -k http://<HTTP_server>/worker.ign
다음 명령으로 실행하여 새 머신을 부팅하기 위해 ISO 이미지에 액세스할 수 있습니다.
RHCOS_VHD_ORIGIN_URL=$(oc -n openshift-machine-config-operator get configmap/coreos-bootimages -o jsonpath='{.data.stream}' | jq -r '.architectures.<architecture>.artifacts.metal.formats.iso.disk.location')
ISO 파일을 사용하여 추가 컴퓨팅 머신에 RHCOS를 설치합니다. 클러스터를 설치하기 전에 머신을 만들 때 사용한 것과 동일한 방법을 사용합니다.
- ISO 이미지를 디스크에 굽고 직접 부팅합니다.
- LOM 인터페이스에서 ISO 리디렉션을 사용합니다.
옵션을 지정하거나 라이브 부팅 시퀀스를 중단하지 않고 RHCOS ISO 이미지를 부팅합니다. 설치 프로그램이 RHCOS 라이브 환경에서 쉘 프롬프트로 부팅될 때까지 기다립니다.
참고커널 인수를 추가하기 위해 RHCOS 설치 부팅 프로세스를 중단할 수 있습니다. 그러나 이 ISO 프로세스에서는 커널 인수를 추가하는 대신 다음 단계에 설명된 대로
coreos-installer
명령을 사용해야 합니다.coreos-installer
명령을 실행하고 설치 요구 사항을 충족하는 옵션을 지정합니다. 최소한 노드 유형에 대한 Ignition 구성 파일과 설치할 장치를 가리키는 URL을 지정해야 합니다.$ sudo coreos-installer install --ignition-url=http://<HTTP_server>/<node_type>.ign <device> --ignition-hash=sha512-<digest> 12
참고TLS를 사용하는 HTTPS 서버를 통해 Ignition 구성 파일을 제공하려는 경우
coreos-installer
를 실행하기 전에 내부 인증 기관(CA)을 시스템 신뢰 저장소에 추가할 수 있습니다.다음 예제에서는
/dev/sda
장치에 부트스트랩 노드 설치를 초기화합니다. 부트스트랩 노드의 Ignition 구성 파일은 IP 주소 192.168.1.2가 있는 HTTP 웹 서버에서 가져옵니다.$ sudo coreos-installer install --ignition-url=http://192.168.1.2:80/installation_directory/bootstrap.ign /dev/sda --ignition-hash=sha512-a5a2d43879223273c9b60af66b44202a1d1248fc01cf156c46d4a79f552b6bad47bc8cc78ddf0116e80c59d2ea9e32ba53bc807afbca581aa059311def2c3e3b
머신 콘솔에서 RHCOS 설치 진행률을 모니터링합니다.
중요OpenShift Container Platform 설치를 시작하기 전에 각 노드에서 성공적으로 설치되었는지 확인합니다. 설치 프로세스를 관찰하면 발생할 수 있는 RHCOS 설치 문제의 원인을 파악하는 데 도움이 될 수 있습니다.
- 계속해서 클러스터에 추가 컴퓨팅 머신을 만듭니다.
11.5.2.2. PXE 또는 iPXE 부팅을 통해 RHCOS 머신 생성
PXE 또는 iPXE 부팅을 사용하여 베어 메탈 클러스터에 대해 추가 Red Hat Enterprise Linux CoreOS (RHCOS) 컴퓨팅 머신을 생성할 수 있습니다.
사전 요구 사항
- 클러스터의 컴퓨팅 머신에 대한 Ignition 구성 파일의 URL을 가져옵니다. 설치 중에 이 파일은 HTTP 서버에 업로드되어 있어야 합니다.
-
클러스터 설치 중에 HTTP 서버에 업로드 한 RHCOS ISO 이미지, 압축된 메탈 BIOS,
kernel
및initramfs
파일의 URL을 가져옵니다. - 설치 중에 OpenShift Container Platform 클러스터에 대한 머신을 생성하는 데 사용한 PXE 부팅 인프라에 액세스할 수 있습니다. RHCOS가 설치된 후 로컬 디스크에서 머신을 부팅해야합니다.
-
UEFI를 사용하는 경우 OpenShift Container Platform 설치 중에 수정 한
grub.conf
파일에 액세스할 수 있습니다.
절차
RHCOS 이미지의 PXE 또는 iPXE가 올바르게 설치되었는지 확인합니다.
PXE의 경우:
DEFAULT pxeboot TIMEOUT 20 PROMPT 0 LABEL pxeboot KERNEL http://<HTTP_server>/rhcos-<version>-live-kernel-<architecture> 1 APPEND initrd=http://<HTTP_server>/rhcos-<version>-live-initramfs.<architecture>.img coreos.inst.install_dev=/dev/sda coreos.inst.ignition_url=http://<HTTP_server>/worker.ign coreos.live.rootfs_url=http://<HTTP_server>/rhcos-<version>-live-rootfs.<architecture>.img 2
- 1
- HTTP 서버에 업로드한 라이브
kernel
파일의 위치를 지정합니다. - 2
- HTTP 서버에 업로드한 RHCOS 파일의 위치를 지정합니다.
initrd
매개변수 값은initramfs
파일의 위치이고coreos.inst.ignition_url
매개변수 값은 작업자 Ignition 설정 파일의 위치이며coreos.live.rootfs_url
매개 변수 값은 라이브rootfs
파일의 위치입니다.coreos.inst.ignition_url
및coreos.live.rootfs_url
매개변수는 HTTP 및 HTTPS만 지원합니다.
참고이 구성은 그래픽 콘솔이 있는 시스템에서 직렬 콘솔 액세스를 활성화하지 않습니다. 다른 콘솔을 구성하려면
APPEND
행에 하나 이상의console=
인수를 추가합니다. 예를 들어console=tty0 console=ttyS0
을 추가하여 첫 번째 PC 직렬 포트를 기본 콘솔로 설정하고 그래픽 콘솔을 보조 콘솔로 설정합니다. 자세한 내용은 Red Hat Enterprise Linux에서 직렬 터미널 및/또는 콘솔 설정 방법을 참조하십시오.iPXE의 경우 (
x86_64
+aarch64
).kernel http://<HTTP_server>/rhcos-<version>-live-kernel-<architecture> initrd=main coreos.live.rootfs_url=http://<HTTP_server>/rhcos-<version>-live-rootfs.<architecture>.img coreos.inst.install_dev=/dev/sda coreos.inst.ignition_url=http://<HTTP_server>/worker.ign 1 2 initrd --name main http://<HTTP_server>/rhcos-<version>-live-initramfs.<architecture>.img 3 boot
- 1
- HTTP 서버에 업로드한 RHCOS 파일의 위치를 지정합니다.
kernel
매개변수 값은kernel
파일의 위치이고initrd=main
인수는 UEFI 시스템에서 부팅하는 데 필요하며coreos.live.rootfs_url
매개변수 값은rootfs
파일의 위치이며coreos.inst.ignition_url
매개 변수 값은 작업자 Ignition 구성 파일의 위치입니다. - 2
- NIC를 여러 개 사용하는 경우
ip
옵션에 단일 인터페이스를 지정합니다. 예를 들어,eno1
라는 NIC에서 DHCP를 사용하려면ip=eno1:dhcp
를 설정하십시오. - 3
- HTTP 서버에 업로드한
initramfs
파일의 위치를 지정합니다.
참고이 구성은 그래픽 콘솔이 있는 시스템에서 직렬 콘솔 액세스를 활성화하지 않습니다. 다른 콘솔을 구성하려면
커널
행에 하나 이상의console=
인수를 추가합니다. 예를 들어console=tty0 console=ttyS0
을 추가하여 첫 번째 PC 직렬 포트를 기본 콘솔로 설정하고 그래픽 콘솔을 보조 콘솔로 설정합니다. 자세한 내용은 How does one set up a serial terminal and/or console in Red Hat Enterprise Linux? 및 "고급 RHCOS 설치 구성" 섹션의 "프로비저닝 콘솔 활성화"를 참조하십시오.참고aarch64
아키텍처에서 CoreOS커널
을 네트워킹하려면IMAGE_GZIP
옵션이 활성화된 iPXE 빌드 버전을 사용해야 합니다. iPXE의IMAGE_GZIP
옵션을 참조하십시오.aarch64
에서 PXE ( UEFI 및 GRUB을 두 번째 단계로 포함)의 경우 :menuentry 'Install CoreOS' { linux rhcos-<version>-live-kernel-<architecture> coreos.live.rootfs_url=http://<HTTP_server>/rhcos-<version>-live-rootfs.<architecture>.img coreos.inst.install_dev=/dev/sda coreos.inst.ignition_url=http://<HTTP_server>/worker.ign 1 2 initrd rhcos-<version>-live-initramfs.<architecture>.img 3 }
- 1
- HTTP/TFTP 서버에 업로드한 RHCOS 파일의 위치를 지정합니다.
kernel
매개변수 값은 TFTP 서버의파일의 위치입니다.
coreos.live.rootfs_url
매개변수 값은rootfs
파일의 위치이며coreos.inst.ignition_url
매개변수 값은 HTTP Server의 작업자 Ignition 구성 파일의 위치입니다. - 2
- NIC를 여러 개 사용하는 경우
ip
옵션에 단일 인터페이스를 지정합니다. 예를 들어,eno1
라는 NIC에서 DHCP를 사용하려면ip=eno1:dhcp
를 설정하십시오. - 3
- TFTP 서버에 업로드한
initramfs
파일의 위치를 지정합니다.
- PXE 또는 iPXE 인프라를 사용하여 클러스터에 필요한 컴퓨팅 머신을 만듭니다.
11.5.3. 시스템의 인증서 서명 요청 승인
클러스터에 시스템을 추가하면 추가한 시스템별로 보류 중인 인증서 서명 요청(CSR)이 두 개씩 생성됩니다. 이러한 CSR이 승인되었는지 확인해야 하며, 필요한 경우 이를 직접 승인해야 합니다. 클라이언트 요청을 먼저 승인한 다음 서버 요청을 승인해야 합니다.
사전 요구 사항
- 클러스터에 시스템을 추가했습니다.
절차
클러스터가 시스템을 인식하는지 확인합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 63m v1.26.0 master-1 Ready master 63m v1.26.0 master-2 Ready master 64m v1.26.0
출력에 생성된 모든 시스템이 나열됩니다.
참고이전 출력에는 일부 CSR이 승인될 때까지 컴퓨팅 노드(작업자 노드라고도 함)가 포함되지 않을 수 있습니다.
보류 중인 CSR을 검토하고 클러스터에 추가한 각 시스템에 대해
Pending
또는Approved
상태의 클라이언트 및 서버 요청이 표시되는지 확인합니다.$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-8b2br 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending csr-8vnps 15m system:serviceaccount:openshift-machine-config-operator:node-bootstrapper Pending ...
예에서는 두 시스템이 클러스터에 참여하고 있습니다. 목록에는 승인된 CSR이 더 많이 나타날 수도 있습니다.
CSR이 승인되지 않은 경우, 추가된 시스템에 대한 모든 보류 중인 CSR이
Pending
상태로 전환된 후 클러스터 시스템의 CSR을 승인합니다.참고CSR은 교체 주기가 자동으로 만료되므로 클러스터에 시스템을 추가한 후 1시간 이내에 CSR을 승인하십시오. 한 시간 내에 승인하지 않으면 인증서가 교체되고 각 노드에 대해 두 개 이상의 인증서가 표시됩니다. 이러한 인증서를 모두 승인해야 합니다. 클라이언트 CSR이 승인되면 Kubelet은 인증서에 대한 보조 CSR을 생성하므로 수동 승인이 필요합니다. 그러면 Kubelet에서 동일한 매개변수를 사용하여 새 인증서를 요청하는 경우 인증서 갱신 요청은
machine-approver
에 의해 자동으로 승인됩니다.참고베어 메탈 및 기타 사용자 프로비저닝 인프라와 같이 머신 API를 사용하도록 활성화되지 않는 플랫폼에서 실행되는 클러스터의 경우 CSR(Kubelet service Certificate Request)을 자동으로 승인하는 방법을 구현해야 합니다. 요청이 승인되지 않으면 API 서버가 kubelet에 연결될 때 서비스 인증서가 필요하므로
oc exec
,oc rsh
,oc logs
명령을 성공적으로 수행할 수 없습니다. Kubelet 엔드 포인트에 연결하는 모든 작업을 수행하려면 이 인증서 승인이 필요합니다. 이 방법은 새 CSR을 감시하고 CSR이system:node
또는system:admin
그룹의node-bootstrapper
서비스 계정에 의해 제출되었는지 확인하고 노드의 ID를 확인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs --no-run-if-empty oc adm certificate approve
참고일부 Operator는 일부 CSR이 승인될 때까지 사용할 수 없습니다.
이제 클라이언트 요청이 승인되었으므로 클러스터에 추가한 각 머신의 서버 요청을 검토해야 합니다.
$ oc get csr
출력 예
NAME AGE REQUESTOR CONDITION csr-bfd72 5m26s system:node:ip-10-0-50-126.us-east-2.compute.internal Pending csr-c57lv 5m26s system:node:ip-10-0-95-157.us-east-2.compute.internal Pending ...
나머지 CSR이 승인되지 않고
Pending
상태인 경우 클러스터 머신의 CSR을 승인합니다.개별적으로 승인하려면 유효한 CSR 각각에 대해 다음 명령을 실행하십시오.
$ oc adm certificate approve <csr_name> 1
- 1
<csr_name>
은 현재 CSR 목록에 있는 CSR의 이름입니다.
보류 중인 CSR을 모두 승인하려면 다음 명령을 실행하십시오.
$ oc get csr -o go-template='{{range .items}}{{if not .status}}{{.metadata.name}}{{"\n"}}{{end}}{{end}}' | xargs oc adm certificate approve
모든 클라이언트 및 서버 CSR이 승인된 후 머신은
Ready
상태가 됩니다. 다음 명령을 실행하여 확인합니다.$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master-0 Ready master 73m v1.26.0 master-1 Ready master 73m v1.26.0 master-2 Ready master 74m v1.26.0 worker-0 Ready worker 11m v1.26.0 worker-1 Ready worker 11m v1.26.0
참고머신이
Ready
상태로 전환하는 데 서버 CSR의 승인 후 몇 분이 걸릴 수 있습니다.
추가 정보
- CSR에 대한 자세한 내용은 인증서 서명 요청을 참조하십시오.
12장. 컨트롤 플레인 시스템 관리
12.1. 컨트롤 플레인 머신 세트 정보
컨트롤 플레인 머신 세트를 사용하면 OpenShift Container Platform 클러스터 내에서 컨트롤 플레인 머신 리소스 관리를 자동화할 수 있습니다.
컨트롤 플레인 머신 세트는 컴퓨팅 머신을 관리할 수 없으며 컴퓨팅 머신 세트는 컨트롤 플레인 시스템을 관리할 수 없습니다.
컨트롤 플레인 머신 세트는 컴퓨팅 머신에 제공하는 컴퓨팅 머신 세트와 유사한 관리 기능을 컨트롤 플레인 시스템에 제공합니다. 그러나 이러한 두 가지 유형의 머신 세트는 Machine API에 정의된 별도의 사용자 지정 리소스이며 아키텍처 및 기능에는 몇 가지 근본적인 차이점이 있습니다.
12.1.1. Control Plane Machine Set Operator 개요
Control Plane Machine Set Operator는 ControlPlaneMachineSet
사용자 정의 리소스(CR)를 사용하여 OpenShift Container Platform 클러스터 내에서 컨트롤 플레인 머신 리소스의 관리를 자동화합니다.
클러스터 컨트롤 플레인 머신 세트의 상태가 Active
로 설정된 경우 Operator는 클러스터에 지정된 구성이 있는 컨트롤 플레인 시스템의 올바른 수가 있는지 확인합니다. 이를 통해 성능이 저하된 컨트롤 플레인 머신을 자동으로 교체하고 컨트롤 플레인에 변경 사항을 롤아웃할 수 있습니다.
클러스터에는 하나의 컨트롤 플레인 머신 세트만 있으며 Operator는 openshift-machine-api
네임스페이스의 오브젝트만 관리합니다.
12.1.2. Control Plane Machine Set Operator 제한 사항
Control Plane Machine Set Operator에는 다음과 같은 제한 사항이 있습니다.
- AWS(Amazon Web Services), GCP(Google Cloud Platform), Microsoft Azure 및 VMware vSphere 클러스터만 지원됩니다.
컨트롤 플레인 노드를 나타내는 기존 머신이 없는 클러스터는 컨트롤 플레인 머신 세트를 사용하거나 설치 후 컨트롤 플레인 머신 세트를 사용할 수 없습니다. 일반적으로 기존 컨트롤 플레인 시스템은 설치 프로그램에서 프로비저닝한 인프라를 사용하여 클러스터를 설치한 경우에만 존재합니다.
클러스터에 기존 컨트롤 플레인 시스템이 필요한지 확인하려면 관리자 권한이 있는 사용자로 다음 명령을 실행합니다.
$ oc get machine \ -n openshift-machine-api \ -l machine.openshift.io/cluster-api-machine-role=master
기존 컨트롤 플레인 시스템을 표시하는 출력 예
NAME PHASE TYPE REGION ZONE AGE <infrastructure_id>-master-0 Running m6i.xlarge us-west-1 us-west-1a 5h19m <infrastructure_id>-master-1 Running m6i.xlarge us-west-1 us-west-1b 5h19m <infrastructure_id>-master-2 Running m6i.xlarge us-west-1 us-west-1a 5h19m
기존 컨트롤 플레인 시스템이 누락된 출력 예
No resources found in openshift-machine-api namespace.
-
Operator는 Machine API Operator가 작동해야 하므로 수동으로 프로비저닝된 머신이 있는 클러스터에서는 지원되지 않습니다. 활성 생성된
ControlPlaneMachineSet
사용자 정의 리소스(CR)를 생성하는 플랫폼에 대해 수동으로 프로비저닝된 머신을 사용하여 OpenShift Container Platform 클러스터를 설치할 때 설치 프로세스에서 지시된 대로 컨트롤 플레인 머신 세트를 정의하는 Kubernetes 매니페스트 파일을 제거해야 합니다. - 컨트롤 플레인 시스템이 세 개인 클러스터만 지원됩니다.
- 컨트롤 플레인의 수평 스케일링은 지원되지 않습니다.
- 임시 OS 디스크에 Azure 컨트롤 플레인 머신을 배포하면 데이터 손실 위험이 증가하고 지원되지 않습니다.
컨트롤 플레인 머신을 AWS Spot 인스턴스, GCP 선점 가능 VM 또는 Azure Spot 가상 머신으로 배포할 수 없습니다.
중요컨트롤 플레인 머신을 AWS Spot 인스턴스로, GCP 선점 가능 VM 또는 Azure Spot 가상 머신을 배포하려고 하면 클러스터가 etcd 쿼럼이 손실될 수 있습니다. 모든 컨트롤 플레인 시스템이 동시에 손실되는 클러스터는 복구할 수 없습니다.
- 설치 중 또는 설치 전에 컨트롤 플레인 머신 세트를 변경하는 것은 지원되지 않습니다. 설치 후만 컨트롤 플레인 머신을 변경해야 합니다.
12.1.3. 추가 리소스
12.2. 컨트롤 플레인 머신 세트 시작하기
컨트롤 플레인 머신 세트를 시작하는 프로세스는 클러스터의 ControlPlaneMachineSet
CR(사용자 정의 리소스)의 상태에 따라 다릅니다.
- 활성 생성된 CR이 있는 클러스터
- 활성 상태의 생성된 CR이 있는 클러스터는 기본적으로 컨트롤 플레인 머신 세트를 사용합니다. 관리자 작업이 필요하지 않습니다.
- 비활성 생성된 CR이 있는 클러스터
- 비활성 생성된 CR이 포함된 클러스터의 경우 CR 구성을 검토하고 CR을 활성화해야 합니다.
- 생성된 CR이 없는 클러스터
- 생성된 CR을 포함하지 않는 클러스터의 경우 클러스터에 적절한 구성으로 CR을 생성하고 활성화해야 합니다.
클러스터에서 ControlPlaneMachineSet
CR의 상태에 대해 확신이 있는 경우 CR 상태를 확인할 수 있습니다.
12.2.1. 지원되는 클라우드 공급자
OpenShift Container Platform 4.13에서는 AWS(Amazon Web Services), GCP(Google Cloud Platform), Microsoft Azure 및 VMware vSphere 클러스터에서 컨트롤 플레인 머신 세트가 지원됩니다.
설치 후 컨트롤 플레인 머신 세트의 상태는 클라우드 공급자와 클러스터에 설치한 OpenShift Container Platform 버전에 따라 다릅니다.
클라우드 공급자 | 활성 상태 | 생성된 CR | 수동 CR 필요 |
---|---|---|---|
AWS(Amazon Web Services) | X [1] | X | |
GCP(Google Cloud Platform) | X [2] | X | |
Microsoft Azure | X [2] | X | |
VMware vSphere | X |
12.2.2. 컨트롤 플레인 시스템 세트 사용자 정의 리소스 상태 확인
ControlPlaneMachineSet
CR(사용자 정의 리소스)의 존재 및 상태를 확인할 수 있습니다.
절차
다음 명령을 실행하여 CR의 상태를 확인합니다.
$ oc get controlplanemachineset.machine.openshift.io cluster \ --namespace openshift-machine-api
-
Active
의 결과는ControlPlaneMachineSet
CR이 존재하고 활성화되어 있음을 나타냅니다. 관리자 작업이 필요하지 않습니다. -
비활성
결과는ControlPlaneMachineSet
CR이 존재하지만 활성화되지 않음을 나타냅니다. -
NotFound
의 결과는ControlPlaneMachineSet
CR이 없음을 나타냅니다.
-
다음 단계
컨트롤 플레인 머신 세트를 사용하려면 클러스터에 대한 올바른 설정이 있는 ControlPlaneMachineSet
CR이 있는지 확인해야 합니다.
- 클러스터에 기존 CR이 있는 경우 CR의 구성이 클러스터에 적합한지 확인해야 합니다.
- 클러스터에 기존 CR이 없는 경우 클러스터에 대한 올바른 구성으로 클러스터를 생성해야 합니다.
12.2.3. 컨트롤 플레인 머신 세트 사용자 정의 리소스 활성화
컨트롤 플레인 머신 세트를 사용하려면 클러스터에 대한 올바른 설정이 있는 ControlPlaneMachineSet
CR(사용자 정의 리소스)이 있는지 확인해야 합니다. CR이 생성된 클러스터에서 CR의 구성이 클러스터에 적합한지 확인하고 활성화해야 합니다.
CR의 매개변수에 대한 자세한 내용은 "Control Plane machine set configuration"을 참조하십시오.
절차
다음 명령을 실행하여 CR 구성을 확인합니다.
$ oc --namespace openshift-machine-api edit controlplanemachineset.machine.openshift.io cluster
- 클러스터 구성에 올바르지 않은 필드의 값을 변경합니다.
구성이 올바르면
.spec.state
필드를Active
로 설정하고 변경 사항을 저장하여 CR을 활성화합니다.중요CR을 활성화하려면 CR 구성을 업데이트하는 데 사용하는 동일한
oc edit
세션에서.spec.state
필드를Active
로 변경해야 합니다. CR이Inactive
으로 남아 있는 상태로 저장된 경우 컨트롤 플레인 머신 세트 생성기는 CR을 원래 설정으로 재설정합니다.
12.2.4. 컨트롤 플레인 머신 세트 사용자 정의 리소스 생성
컨트롤 플레인 머신 세트를 사용하려면 클러스터에 대한 올바른 설정이 있는 ControlPlaneMachineSet
CR(사용자 정의 리소스)이 있는지 확인해야 합니다. 생성된 CR이 없는 클러스터에서 CR을 수동으로 생성하고 활성화해야 합니다.
CR의 구조 및 매개변수에 대한 자세한 내용은 "Control Plane machine set configuration"을 참조하십시오.
절차
다음 템플릿을 사용하여 YAML 파일을 생성합니다.
컨트롤 플레인 머신 세트 CR YAML 파일 템플릿
apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet metadata: name: cluster namespace: openshift-machine-api spec: replicas: 3 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <cluster_id> 1 machine.openshift.io/cluster-api-machine-role: master machine.openshift.io/cluster-api-machine-type: master state: Active 2 strategy: type: RollingUpdate 3 template: machineType: machines_v1beta1_machine_openshift_io machines_v1beta1_machine_openshift_io: failureDomains: platform: <platform> 4 <platform_failure_domains> 5 metadata: labels: machine.openshift.io/cluster-api-cluster: <cluster_id> 6 machine.openshift.io/cluster-api-machine-role: master machine.openshift.io/cluster-api-machine-type: master spec: providerSpec: value: <platform_provider_spec> 7
- 1
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다.
ControlPlaneMachineSet
CR을 생성할 때 이 값을 지정해야 합니다. OpenShift CLI (oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 2
- Operator의 상태를 지정합니다. 상태가
Inactive
이면 Operator가 작동하지 않습니다. 값을Active
로 설정하여 Operator를 활성화할 수 있습니다.중요CR을 활성화하기 전에 클러스터 요구 사항에 맞게 구성이 올바른지 확인해야 합니다.
- 3
- 클러스터에 대한 업데이트 전략을 지정합니다. 허용되는 값은
OnDelete
및RollingUpdate
입니다. 기본값은RollingUpdate
입니다. - 4
- 클라우드 공급자 플랫폼 이름을 지정합니다. 허용되는 값은
AWS
,Azure
,GCP
및VSphere
입니다. - 5
- 클러스터에 대한 &
lt;platform_failure_domains&
gt; 구성을 추가합니다. 이 섹션의 형식과 값은 공급자에 따라 다릅니다. 자세한 내용은 클라우드 공급자의 샘플 실패 도메인 구성을 참조하십시오.참고VMware vSphere는 장애 도메인을 지원하지 않습니다. vSphere 클러스터의 경우 <
platform_failure_domains
>를 빈failureDomains:
매개변수로 바꿉니다. - 6
- 인프라 ID를 지정합니다.
- 7
- 클러스터에 대한 &
lt;platform_provider_spec&
gt; 구성을 추가합니다. 이 섹션의 형식과 값은 공급자에 따라 다릅니다. 자세한 내용은 클라우드 공급자의 샘플 공급자 사양을 참조하십시오.
- 컨트롤 플레인 머신 세트 CR의 샘플 YAML을 참조하여 파일을 클러스터 구성에 적합한 값으로 채웁니다.
- 클라우드 공급자에 대한 샘플 실패 도메인 구성 및 샘플 공급자 사양을 참조하여 파일의 해당 섹션을 적절한 값으로 업데이트합니다.
-
구성이 올바르면
.spec.state
필드를Active
로 설정하고 변경 사항을 저장하여 CR을 활성화합니다. 다음 명령을 실행하여 YAML 파일에서 CR을 생성합니다.
$ oc create -f <control_plane_machine_set>.yaml
여기서
<control_plane_machine_set
>은 CR 구성이 포함된 YAML 파일의 이름입니다.
12.3. 컨트롤 플레인 머신 세트 구성
이 예제 YAML 파일 및 스니펫에서는 컨트롤 플레인 머신 세트 CR(사용자 정의 리소스) 및 공급자 사양 및 실패 도메인 구성에 대한 플랫폼별 샘플의 기본 구조를 보여줍니다.
12.3.1. 컨트롤 플레인 머신 세트 사용자 정의 리소스의 샘플 YAML
ControlPlaneMachineSet
CR의 기반은 모든 플랫폼에 대해 동일한 방식으로 구성됩니다.
ControlPlaneMachineSet
CR YAML 파일 샘플
apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet metadata: name: cluster 1 namespace: openshift-machine-api spec: replicas: 3 2 selector: matchLabels: machine.openshift.io/cluster-api-cluster: <cluster_id> 3 machine.openshift.io/cluster-api-machine-role: master machine.openshift.io/cluster-api-machine-type: master state: Active 4 strategy: type: RollingUpdate 5 template: machineType: machines_v1beta1_machine_openshift_io machines_v1beta1_machine_openshift_io: failureDomains: platform: <platform> 6 <platform_failure_domains> 7 metadata: labels: machine.openshift.io/cluster-api-cluster: <cluster_id> machine.openshift.io/cluster-api-machine-role: master machine.openshift.io/cluster-api-machine-type: master spec: providerSpec: value: <platform_provider_spec> 8
- 1
클러스터
인ControlPlaneMachineSet
CR의 이름을 지정합니다. 이 값은 변경하지 마십시오.- 2
- 컨트롤 플레인 머신 수를 지정합니다. 컨트롤 플레인 시스템이 세 개인 클러스터만 지원되므로
replicas
값은3
입니다. 수평 스케일링은 지원되지 않습니다. 이 값은 변경하지 마십시오. - 3
- 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID를 지정합니다.
ControlPlaneMachineSet
CR을 생성할 때 이 값을 지정해야 합니다. OpenShift CLI (oc
) 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 4
- Operator의 상태를 지정합니다. 상태가
Inactive
이면 Operator가 작동하지 않습니다. 값을Active
로 설정하여 Operator를 활성화할 수 있습니다.중요Operator를 활성화하기 전에 클러스터 요구 사항에 맞게
ControlPlaneMachineSet
CR 구성이 올바른지 확인해야 합니다. 컨트롤 플레인 머신 세트 Operator 활성화에 대한 자세한 내용은 "컨트롤 플레인 머신 세트 시작"을 참조하십시오. - 5
- 클러스터의 업데이트 전략을 지정합니다. 허용되는 값은
OnDelete
및RollingUpdate
입니다. 기본값은RollingUpdate
입니다. 업데이트 전략에 대한 자세한 내용은 "컨트롤 플레인 구성 업데이트"를 참조하십시오. - 6
- 클라우드 공급자 플랫폼 이름을 지정합니다. 이 값은 변경하지 마십시오.
- 7
- 클러스터에 대한 &
lt;platform_failure_domains&
gt; 구성을 지정합니다. 이 섹션의 형식과 값은 공급자에 따라 다릅니다. 자세한 내용은 클라우드 공급자의 샘플 실패 도메인 구성을 참조하십시오.참고VMware vSphere는 장애 도메인을 지원하지 않습니다.
- 8
- 클러스터의 <
;platform_provider_spec&
gt; 구성을 지정합니다. 이 섹션의 형식과 값은 공급자에 따라 다릅니다. 자세한 내용은 클라우드 공급자의 샘플 공급자 사양을 참조하십시오.
공급자별 구성
컨트롤 플레인 머신 세트 리소스의 <
> 섹션은 공급자마다 다릅니다. 클러스터의 예제 YAML을 참조하십시오.
platform_provider_spec
> 및 <platform_failure_domains
12.3.2. Amazon Web Services 클러스터 구성을 위한 샘플 YAML
컨트롤 플레인 머신 세트 CR의 일부 섹션은 공급자별로 다릅니다. 이 섹션의 예제 YAML에는 AWS(Amazon Web Services) 클러스터의 공급자 사양 및 실패 도메인 구성이 표시되어 있습니다.
12.3.2.1. 샘플 AWS 공급자 사양
기존 클러스터에 대한 컨트롤 플레인 머신 세트를 생성할 때 공급자 사양이 설치 프로그램에 의해 생성된 컨트롤 플레인 머신
CR의 providerSpec
구성과 일치해야 합니다. CR의 failure domain 섹션에 설정된 모든 필드를 생략할 수 있습니다.
다음 예에서 < cluster_id
>는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
샘플 AWS providerSpec
값
providerSpec: value: ami: id: ami-<ami_id_string> 1 apiVersion: machine.openshift.io/v1beta1 blockDevices: - ebs: 2 encrypted: true iops: 0 kmsKey: arn: "" volumeSize: 120 volumeType: gp3 credentialsSecret: name: aws-cloud-credentials 3 deviceIndex: 0 iamInstanceProfile: id: <cluster_id>-master-profile 4 instanceType: m6i.xlarge 5 kind: AWSMachineProviderConfig 6 loadBalancers: 7 - name: <cluster_id>-int type: network - name: <cluster_id>-ext type: network metadata: creationTimestamp: null metadataServiceOptions: {} placement: 8 region: <region> 9 securityGroups: - filters: - name: tag:Name values: - <cluster_id>-master-sg 10 subnet: {} 11 userDataSecret: name: master-user-data 12
- 1
- 클러스터의 RHCOS(Red Hat Enterprise Linux CoreOS) Amazon 머신 이미지(AMI) ID를 지정합니다. AMI는 클러스터와 동일한 리전에 속해 있어야 합니다. AWS Marketplace 이미지를 사용하려면 리전의 AMI ID를 얻으려면 AWS Marketplace 에서 OpenShift Container Platform 서브스크립션을 완료해야 합니다.
- 2
- 암호화된 EBS 볼륨의 구성을 지정합니다.
- 3
- 클러스터의 시크릿 이름을 지정합니다. 이 값은 변경하지 마십시오.
- 4
- AWS IAM(Identity and Access Management) 인스턴스 프로필을 지정합니다. 이 값은 변경하지 마십시오.
- 5
- 컨트롤 플레인의 AWS 인스턴스 유형을 지정합니다.
- 6
- 클라우드 공급자 플랫폼 유형을 지정합니다. 이 값은 변경하지 마십시오.
- 7
- 클러스터의 내부(
int
) 및 외부(ext
) 로드 밸런서를 지정합니다.참고프라이빗 OpenShift Container Platform 클러스터에서 외부(
ext
) 로드 밸런서 매개변수를 생략할 수 있습니다. - 8
- 이 매개변수는 실패 도메인에 구성되며 여기에 빈 값으로 표시됩니다. 이 매개변수에 지정된 값이 실패 도메인의 값과 다른 경우 Operator는 실패 도메인의 값으로 덮어씁니다.
- 9
- 클러스터의 AWS 리전을 지정합니다.
- 10
- 컨트롤 플레인 시스템 보안 그룹을 지정합니다.
- 11
- 이 매개변수는 실패 도메인에 구성되며 여기에 빈 값으로 표시됩니다. 이 매개변수에 지정된 값이 실패 도메인의 값과 다른 경우 Operator는 실패 도메인의 값으로 덮어씁니다.
- 12
- 컨트롤 플레인 사용자 데이터 시크릿을 지정합니다. 이 값은 변경하지 마십시오.
12.3.2.2. AWS 실패 도메인 구성 샘플
장애 도메인의 컨트롤 플레인 머신 세트 개념은 기존 AWS의 가용성 영역(AZ) 개념과 유사합니다. ControlPlaneMachineSet
CR은 가능한 경우 컨트롤 플레인 머신을 여러 장애 도메인에 분배합니다.
컨트롤 플레인 머신 세트에서 AWS 실패 도메인을 구성할 때 사용할 가용성 영역 이름과 서브넷을 지정해야 합니다.
AWS 실패 도메인 값 샘플
failureDomains: aws: - placement: availabilityZone: <aws_zone_a> 1 subnet: 2 filters: - name: tag:Name values: - <cluster_id>-private-<aws_zone_a> 3 type: Filters 4 - placement: availabilityZone: <aws_zone_b> 5 subnet: filters: - name: tag:Name values: - <cluster_id>-private-<aws_zone_b> 6 type: Filters platform: AWS 7
- 1
- 첫 번째 실패 도메인의 AWS 가용성 영역을 지정합니다.
- 2
- 서브넷 구성을 지정합니다. 이 예제에서 서브넷 유형은
Filters
이므로필터
스탠자가 있습니다. - 3
- 인프라 ID 및 AWS 가용성 영역을 사용하여 첫 번째 실패 도메인의 서브넷 이름을 지정합니다.
- 4
- 서브넷 유형을 지정합니다. 허용되는 값은
ARN
,필터
및ID
입니다. 기본값은Filters
입니다. - 5
- 인프라 ID 및 AWS 가용성 영역을 사용하여 추가 실패 도메인의 서브넷 이름을 지정합니다.
- 6
- 추가 실패 도메인에 대한 클러스터의 인프라 ID 및 AWS 가용 영역을 지정합니다.
- 7
- 클라우드 공급자 플랫폼 이름을 지정합니다. 이 값은 변경하지 마십시오.
12.3.3. Google Cloud Platform 클러스터 구성을 위한 샘플 YAML
컨트롤 플레인 머신 세트 CR의 일부 섹션은 공급자별로 다릅니다. 이 섹션의 예제 YAML에는 GCP(Google Cloud Platform) 클러스터의 공급자 사양 및 실패 도메인 구성이 표시되어 있습니다.
12.3.3.1. 샘플 GCP 공급자 사양
기존 클러스터에 대한 컨트롤 플레인 머신 세트를 생성할 때 공급자 사양은 설치 프로그램에서 생성한 컨트롤 플레인 머신 CR(사용자 정의 리소스)의 providerSpec
구성과 일치해야 합니다. CR의 failure domain 섹션에 설정된 모든 필드를 생략할 수 있습니다.
OpenShift CLI를 사용하여 얻은 값
다음 예제에서는 OpenShift CLI를 사용하여 클러스터의 일부 값을 가져올 수 있습니다.
- 인프라 ID
&
lt;cluster_id
> 문자열은 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
- 이미지 경로
&
lt;path_to_image
> 문자열은 디스크를 만드는 데 사용된 이미지의 경로입니다. OpenShift CLI가 설치되어 있으면 다음 명령을 실행하여 이미지에 대한 경로를 얻을 수 있습니다.$ oc -n openshift-machine-api \ -o jsonpath='{.spec.template.machines_v1beta1_machine_openshift_io.spec.providerSpec.value.disks[0].image}{"\n"}' \ get ControlPlaneMachineSet/cluster
샘플 GCP providerSpec
값
apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet metadata: name: cluster namespace: openshift-machine-api spec: # ... template: # ... spec: providerSpec: value: apiVersion: machine.openshift.io/v1beta1 canIPForward: false credentialsSecret: name: gcp-cloud-credentials 1 deletionProtection: false disks: - autoDelete: true boot: true image: <path_to_image> 2 labels: null sizeGb: 200 type: pd-ssd kind: GCPMachineProviderSpec 3 machineType: e2-standard-4 metadata: creationTimestamp: null metadataServiceOptions: {} networkInterfaces: - network: <cluster_id>-network subnetwork: <cluster_id>-master-subnet projectID: <project_name> 4 region: <region> 5 serviceAccounts: 6 - email: <cluster_id>-m@<project_name>.iam.gserviceaccount.com scopes: - https://www.googleapis.com/auth/cloud-platform shieldedInstanceConfig: {} tags: - <cluster_id>-master targetPools: - <cluster_id>-api userDataSecret: name: master-user-data 7 zone: "" 8
- 1
- 클러스터의 시크릿 이름을 지정합니다. 이 값은 변경하지 마십시오.
- 2
- 디스크를 만드는 데 사용된 이미지의 경로를 지정합니다.
GCP Marketplace 이미지를 사용하려면 사용할 오퍼를 지정합니다.
-
OpenShift Container Platform:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-ocp-413-x86-64-202305021736
-
OpenShift Platform Plus:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-opp-413-x86-64-202305021736
-
OpenShift Kubernetes Engine:
https://www.googleapis.com/compute/v1/projects/redhat-marketplace-public/global/images/redhat-coreos-oke-413-x86-64-202305021736
-
OpenShift Container Platform:
- 3
- 클라우드 공급자 플랫폼 유형을 지정합니다. 이 값은 변경하지 마십시오.
- 4
- 클러스터에 사용하는 GCP 프로젝트의 이름을 지정합니다.
- 5
- 클러스터의 GCP 리전을 지정합니다.
- 6
- 단일 서비스 계정을 지정합니다. 여러 서비스 계정이 지원되지 않습니다.
- 7
- 컨트롤 플레인 사용자 데이터 시크릿을 지정합니다. 이 값은 변경하지 마십시오.
- 8
- 이 매개변수는 실패 도메인에 구성되며 여기에 빈 값으로 표시됩니다. 이 매개변수에 지정된 값이 실패 도메인의 값과 다른 경우 Operator는 실패 도메인의 값으로 덮어씁니다.
12.3.3.2. 샘플 GCP 실패 도메인 구성
장애 도메인의 컨트롤 플레인 머신 세트 개념은 영역 의 기존 GCP 개념과 유사합니다. ControlPlaneMachineSet
CR은 가능한 경우 컨트롤 플레인 머신을 여러 장애 도메인에 분배합니다.
컨트롤 플레인 머신 세트에서 GCP 실패 도메인을 구성할 때 사용할 영역 이름을 지정해야 합니다.
샘플 GCP 실패 도메인 값
failureDomains: gcp: - zone: <gcp_zone_a> 1 - zone: <gcp_zone_b> 2 - zone: <gcp_zone_c> - zone: <gcp_zone_d> platform: GCP 3
12.3.4. Microsoft Azure 클러스터 구성을 위한 샘플 YAML
컨트롤 플레인 머신 세트 CR의 일부 섹션은 공급자별로 다릅니다. 이 섹션의 예제 YAML에는 Azure 클러스터의 공급자 사양 및 실패 도메인 구성이 표시되어 있습니다.
12.3.4.1. Azure 공급자 사양 샘플
기존 클러스터에 대한 컨트롤 플레인 머신 세트를 생성할 때 공급자 사양이 설치 프로그램에 의해 생성된 컨트롤 플레인 머신
CR의 providerSpec
구성과 일치해야 합니다. CR의 failure domain 섹션에 설정된 모든 필드를 생략할 수 있습니다.
다음 예에서 < cluster_id
>는 클러스터를 프로비저닝할 때 설정한 클러스터 ID를 기반으로 하는 인프라 ID입니다. OpenShift CLI 패키지가 설치되어 있으면 다음 명령을 실행하여 인프라 ID를 얻을 수 있습니다.
$ oc get -o jsonpath='{.status.infrastructureName}{"\n"}' infrastructure cluster
샘플 Azure providerSpec
값
providerSpec: value: acceleratedNetworking: true apiVersion: machine.openshift.io/v1beta1 credentialsSecret: name: azure-cloud-credentials 1 namespace: openshift-machine-api diagnostics: {} image: 2 offer: "" publisher: "" resourceID: /resourceGroups/<cluster_id>-rg/providers/Microsoft.Compute/galleries/gallery_<cluster_id>/images/<cluster_id>-gen2/versions/412.86.20220930 3 sku: "" version: "" internalLoadBalancer: <cluster_id>-internal 4 kind: AzureMachineProviderSpec 5 location: <region> 6 managedIdentity: <cluster_id>-identity metadata: creationTimestamp: null name: <cluster_id> networkResourceGroup: <cluster_id>-rg osDisk: 7 diskSettings: {} diskSizeGB: 1024 managedDisk: storageAccountType: Premium_LRS osType: Linux publicIP: false publicLoadBalancer: <cluster_id> 8 resourceGroup: <cluster_id>-rg subnet: <cluster_id>-master-subnet 9 userDataSecret: name: master-user-data 10 vmSize: Standard_D8s_v3 vnet: <cluster_id>-vnet zone: "" 11
- 1
- 클러스터의 시크릿 이름을 지정합니다. 이 값은 변경하지 마십시오.
- 2
- 컨트롤 플레인 머신 세트의 이미지 세부 정보를 지정합니다.
- 3
- 인스턴스 유형과 호환되는 이미지를 지정합니다. 설치 프로그램에 의해 생성된 Hyper-V 생성 V2 이미지에는
-gen2
접미사가 있으며 V1 이미지는 접미사 없이 이름이 동일합니다. - 4
- 컨트롤 플레인의 내부 로드 밸런서를 지정합니다. 이 필드는 사전 구성되지 않을 수 있지만
ControlPlane
및 컨트롤 플레인 머신 CR 모두에 필요합니다.Machine
Set - 5
- 클라우드 공급자 플랫폼 유형을 지정합니다. 이 값은 변경하지 마십시오.
- 6
- 컨트롤 플레인 시스템을 배치할 리전을 지정합니다.
- 7
- 컨트롤 플레인의 디스크 구성을 지정합니다.
- 8
- 컨트롤 플레인의 공용 로드 밸런서를 지정합니다.참고
사용자 정의 아웃 바운드 라우팅이 있는 프라이빗 OpenShift Container Platform 클러스터에서
publicLoadBalancer
매개변수를 생략할 수 있습니다. - 9
- 컨트롤 플레인의 서브넷을 지정합니다.
- 10
- 컨트롤 플레인 사용자 데이터 시크릿을 지정합니다. 이 값은 변경하지 마십시오.
- 11
- 이 매개변수는 실패 도메인에 구성되며 여기에 빈 값으로 표시됩니다. 이 매개변수에 지정된 값이 실패 도메인의 값과 다른 경우 Operator는 실패 도메인의 값으로 덮어씁니다.
12.3.4.2. Azure 실패 도메인 구성 샘플
장애 도메인의 컨트롤 플레인 머신 세트는 Azure 가용성 영역의 기존 Azure 개념과 유사합니다. ControlPlaneMachineSet
CR은 가능한 경우 컨트롤 플레인 머신을 여러 장애 도메인에 분배합니다.
컨트롤 플레인 머신 세트에서 Azure 실패 도메인을 구성할 때 가용성 영역 이름을 지정해야 합니다.
Azure 실패 도메인 값 샘플
failureDomains: azure: 1 - zone: "1" - zone: "2" - zone: "3" platform: Azure 2
12.3.5. VMware vSphere 클러스터 구성을 위한 샘플 YAML
컨트롤 플레인 머신 세트 CR의 일부 섹션은 공급자별로 다릅니다. 이 섹션의 예제 YAML은 VMware vSphere 클러스터에 대한 공급자 사양 구성을 보여줍니다.
12.3.5.1. 샘플 vSphere 공급자 사양
기존 클러스터에 대한 컨트롤 플레인 머신 세트를 생성할 때 공급자 사양이 설치 프로그램에 의해 생성된 컨트롤 플레인 머신
CR의 providerSpec
구성과 일치해야 합니다.
vSphere providerSpec
값 샘플
providerSpec: value: apiVersion: machine.openshift.io/v1beta1 credentialsSecret: name: vsphere-cloud-credentials 1 diskGiB: 120 2 kind: VSphereMachineProviderSpec 3 memoryMiB: 16384 4 metadata: creationTimestamp: null network: 5 devices: - networkName: <vm_network_name> numCPUs: 4 6 numCoresPerSocket: 4 7 snapshot: "" template: <vm_template_name> 8 userDataSecret: name: master-user-data 9 workspace: datacenter: <vcenter_datacenter_name> 10 datastore: <vcenter_datastore_name> 11 folder: <path_to_vcenter_vm_folder> 12 resourcePool: <vsphere_resource_pool> 13 server: <vcenter_server_ip> 14
- 1
- 클러스터의 시크릿 이름을 지정합니다. 이 값은 변경하지 마십시오.
- 2
- 컨트롤 플레인 시스템의 VM 디스크 크기를 지정합니다.
- 3
- 클라우드 공급자 플랫폼 유형을 지정합니다. 이 값은 변경하지 마십시오.
- 4
- 컨트롤 플레인 머신에 할당된 메모리를 지정합니다.
- 5
- 컨트롤 플레인이 배포된 네트워크를 지정합니다.
- 6
- 컨트롤 플레인 시스템에 할당된 CPU 수를 지정합니다.
- 7
- 각 컨트롤 플레인 CPU의 코어 수를 지정합니다.
- 8
- 사용할 vSphere VM 템플릿(예:
user-5ddjd-rhcos
)을 지정합니다. - 9
- 컨트롤 플레인 사용자 데이터 시크릿을 지정합니다. 이 값은 변경하지 마십시오.
- 10
- 컨트롤 플레인의 vCenter Datacenter를 지정합니다.
- 11
- 컨트롤 플레인의 vCenter Datastore를 지정합니다.
- 12
- vCenter의 vSphere VM 폴더의 경로(예:
/dc1/vm/user-inst-5ddjd
)를 지정합니다. - 13
- VM의 vSphere 리소스 풀을 지정합니다.
- 14
- vCenter 서버 IP 또는 정규화된 도메인 이름을 지정합니다.
12.4. 컨트롤 플레인 머신 세트를 사용하여 컨트롤 플레인 머신 관리
컨트롤 플레인 머신 세트는 컨트롤 플레인 관리의 몇 가지 필수 요소를 자동화합니다.
12.4.1. 컨트롤 플레인 시스템 교체
컨트롤 플레인 머신 세트가 있는 클러스터에서 컨트롤 플레인 시스템을 교체하려면 머신을 수동으로 삭제합니다. 컨트롤 플레인 머신 세트는 컨트롤 플레인 머신 세트 CR(사용자 정의 리소스)의 사양을 사용하여 삭제된 머신을 하나로 대체합니다.
프로세스
다음 명령을 실행하여 클러스터의 컨트롤 플레인 시스템을 나열합니다.
$ oc get machines \ -l machine.openshift.io/cluster-api-machine-role==master \ -n openshift-machine-api
다음 명령을 실행하여 컨트롤 플레인 시스템을 삭제합니다.
$ oc delete machine \ -n openshift-machine-api \ <control_plane_machine_name> 1
- 1
- 삭제할 컨트롤 플레인 시스템의 이름을 지정합니다.
참고여러 컨트롤 플레인 시스템을 삭제하면 컨트롤 플레인 머신 세트가 구성된 업데이트 전략에 따라 이를 대체합니다.
-
기본
RollingUpdate
업데이트 전략을 사용하는 클러스터의 경우 Operator는 각 머신이 교체될 때까지 한 번에 하나의 머신을 교체합니다. -
OnDelete
업데이트 전략을 사용하도록 구성된 클러스터의 경우 Operator는 필요한 모든 대체 머신을 동시에 생성합니다.
두 전략 모두 컨트롤 플레인 머신 교체 중에 etcd 상태를 유지합니다.
12.4.2. 컨트롤 플레인 구성 업데이트
컨트롤 플레인 머신 세트 CR(사용자 정의 리소스)의 사양을 업데이트하여 컨트롤 플레인의 머신 구성을 변경할 수 있습니다.
Control Plane Machine Set Operator는 컨트롤 플레인 머신을 모니터링하고 구성을 컨트롤 플레인 머신 세트 CR의 사양과 비교합니다. CR의 사양과 컨트롤 플레인 머신 구성 사이에 불일치가 있는 경우 Operator는 해당 컨트롤 플레인 머신을 교체하도록 표시합니다.
CR의 매개변수에 대한 자세한 내용은 "Control Plane machine set configuration"을 참조하십시오.
사전 요구 사항
- 클러스터에 컨트롤 플레인 머신 세트 Operator가 활성화 및 작동합니다.
프로세스
다음 명령을 실행하여 컨트롤 플레인 머신 세트 CR을 편집합니다.
$ oc edit controlplanemachineset.machine.openshift.io cluster \ -n openshift-machine-api
- 클러스터 구성에서 업데이트하려는 필드의 값을 변경합니다.
- 변경 사항을 저장하십시오.
다음 단계
-
기본
RollingUpdate
업데이트 전략을 사용하는 클러스터의 경우 컨트롤 플레인 머신 세트는 변경 사항을 컨트롤 플레인 구성에 자동으로 전파합니다. -
OnDelete
업데이트 전략을 사용하도록 구성된 클러스터의 경우 컨트롤 플레인 시스템을 수동으로 교체해야 합니다.
12.4.2.1. 컨트롤 플레인 구성 자동 업데이트
RollingUpdate
업데이트 전략에서는 변경 사항을 컨트롤 플레인 구성에 자동으로 전파합니다. 이 업데이트 전략은 컨트롤 플레인 머신 세트의 기본 구성입니다.
RollingUpdate
업데이트 전략을 사용하는 클러스터의 경우 Operator는 CR에 지정된 구성으로 교체 컨트롤 플레인 머신을 생성합니다. 교체 컨트롤 플레인 시스템이 준비되면 Operator는 교체가 표시된 컨트롤 플레인 시스템을 삭제합니다. 그런 다음 교체 시스템이 컨트롤 플레인에 연결됩니다.
여러 컨트롤 플레인 머신이 교체용으로 표시된 경우 Operator는 각 머신을 교체할 때까지 이 교체 프로세스를 한 번에 하나씩 반복하여 교체하는 동안 etcd 상태를 보호합니다.
12.4.2.2. 컨트롤 플레인 구성에 대한 수동 업데이트
OnDelete
업데이트 전략을 사용하여 머신을 수동으로 교체하여 컨트롤 플레인 구성에 변경 사항을 전파할 수 있습니다. 시스템을 수동으로 교체하면 변경 사항을 보다 효과적으로 적용하기 전에 단일 시스템에서 구성 변경 사항을 테스트할 수 있습니다.
OnDelete
업데이트 전략을 사용하도록 구성된 클러스터의 경우 Operator는 기존 머신을 삭제할 때 교체 컨트롤 플레인 머신을 생성합니다. 교체 컨트롤 플레인 시스템이 준비되면 etcd Operator에서 기존 머신을 삭제할 수 있습니다. 그런 다음 교체 시스템이 컨트롤 플레인에 연결됩니다.
여러 컨트롤 플레인 머신이 삭제되면 Operator는 필요한 모든 교체 머신을 동시에 생성합니다. Operator는 한 번에 두 개 이상의 머신이 컨트롤 플레인에서 제거되지 않도록 하여 etcd 상태를 유지합니다.
12.4.3. 컨트롤 플레인 시스템에 대한 Amazon Web Services 기능 활성화
컨트롤 플레인 머신 세트의 구성을 변경하여 컨트롤 플레인 머신에서 AWS(Amazon Web Services) 기능을 활성화할 수 있습니다. 업데이트를 컨트롤 플레인 머신 세트에 저장하면 컨트롤 플레인 머신 세트 Operator가 구성된 업데이트 전략에 따라 컨트롤 플레인 시스템을 업데이트합니다.
12.4.3.1. API 서버를 프라이빗으로 제한
AWS(Amazon Web Services)에 클러스터를 배포한 후 프라이빗 영역만 사용하도록 API 서버를 재구성할 수 있습니다.
사전 요구 사항
-
OpenShift CLI (
oc
)를 설치합니다. -
admin
권한이 있는 사용자로 웹 콘솔에 액세스합니다.
프로세스
클라우드 공급자의 웹 포털 또는 콘솔에서 다음 작업을 수행합니다.
적절한 로드 밸런서 구성 요소를 찾아 삭제합니다.
- AWS의 경우 외부 로드 밸런서를 삭제합니다. 프라이빗 영역의 API DNS 항목은 동일한 설정을 사용하는 내부 로드 밸런서를 가리키므로 내부 로드 밸런서를 변경할 필요가 없습니다.
-
퍼블릭 영역의
api.$clustername.$yourdomain
DNS 항목을 삭제합니다.
컨트롤 플레인 머신 세트 사용자 정의 리소스에서 다음 행을 삭제하여 외부 로드 밸런서를 제거합니다.
providerSpec: value: loadBalancers: - name: lk4pj-ext 1 type: network 2 - name: lk4pj-int type: network
12.4.3.2. 컨트롤 플레인 머신 세트를 사용하여 Amazon Web Services 인스턴스 유형 변경
컨트롤 플레인 머신 세트 CR(사용자 정의 리소스)에서 사양을 업데이트하여 컨트롤 플레인 시스템이 사용하는 AWS(Amazon Web Services) 인스턴스 유형을 변경할 수 있습니다.
사전 요구 사항
- AWS 클러스터는 컨트롤 플레인 머신 세트를 사용합니다.
절차
providerSpec
필드 아래에 다음 행을 편집합니다.providerSpec: value: ... instanceType: <compatible_aws_instance_type> 1
- 1
- 이전 선택과 동일한 기본으로 더 큰 AWS 인스턴스 유형을 지정합니다. 예를 들어
m6i.xlarge
를m6i.2xlarge
또는m6i.4xlarge
로 변경할 수 있습니다.
- 변경 사항을 저장하십시오.
12.4.3.3. Amazon EC2 인스턴스 메타데이터 서비스에 대한 머신 세트 옵션
머신 세트를 사용하여 특정 버전의 Amazon EC2 Instance Metadata Service(IMDS)를 사용하는 머신을 생성할 수 있습니다. 머신 세트는 IMDSv1 및 IMDSv2 또는 IMDSv2 사용을 필요로 하는 머신 모두를 사용할 수 있는 머신을 생성할 수 있습니다.
IMDSv2 사용은 OpenShift Container Platform 버전 4.7 이상으로 생성된 AWS 클러스터에서만 지원됩니다.
IMDSv2가 필요한 머신을 생성하도록 머신 세트를 구성하기 전에 AWS 메타데이터 서비스와 상호 작용하는 모든 워크로드가 IMDSv2를 지원하는지 확인하십시오.
12.4.3.3.1. 머신 세트를 사용하여 IMDS 구성
머신 세트 YAML 파일에서 metadataServiceOptions.authentication
값을 추가하거나 편집하여 IMDSv2를 사용할지 여부를 지정할 수 있습니다.
사전 요구 사항
- IMDSv2를 사용하려면 OpenShift Container Platform 버전 4.7 이상을 사용하여 AWS 클러스터가 생성되어 있어야 합니다.
절차
providerSpec
필드 아래에 다음 행을 추가하거나 편집합니다.providerSpec: value: metadataServiceOptions: authentication: Required 1
- 1
- IMDSv2를 요구하려면 매개변수 값을
Required
로 설정합니다. IMDSv1 및 IMDSv2를 모두 사용하려면 매개변수 값을Optional
로 설정합니다. 값이 지정되지 않은 경우 IMDSv1 및 IMDSv2 둘 다 허용됩니다.
12.4.3.4. 머신을 Dedicated 인스턴스로 배포하는 머신 세트
AWS에서 실행 중인 머신 세트를 생성하여 머신을 Dedicated 인스턴스로 배포할 수 있습니다. Dedicated 인스턴스는 단일 고객 전용 하드웨어의 VPC(가상 프라이빗 클라우드)에서 실행됩니다. 이러한 Amazon EC2 인스턴스는 호스트 하드웨어 수준에서 물리적으로 분리됩니다. Dedicated 인스턴스의 분리는 인스턴스가 하나의 유료 계정에 연결된 다른 AWS 계정에 속하는 경우에도 발생합니다. 하지만 전용이 아닌 다른 인스턴스는 동일한 AWS 계정에 속하는 경우 Dedicated 인스턴스와 하드웨어를 공유할 수 있습니다.
공용 또는 전용 테넌시가 있는 인스턴스는 Machine API에서 지원됩니다. 공용 테넌시가 있는 인스턴스는 공유 하드웨어에서 실행됩니다. 공용 테넌시는 기본 테넌시입니다. 전용 테넌트가 있는 인스턴스는 단일 테넌트 하드웨어에서 실행됩니다.
12.4.3.4.1. 머신 세트를 사용하여 Dedicated 인스턴스 생성
Machine API 통합을 사용하여 Dedicated 인스턴스에서 지원하는 머신을 실행할 수 있습니다. 머신 세트 YAML 파일의 tenancy
필드를 설정하여 AWS에서 전용 인스턴스를 시작합니다.
절차
providerSpec
필드에서 전용 테넌트를 지정합니다.providerSpec: placement: tenancy: dedicated
12.4.4. 컨트롤 플레인 시스템에 대한 Microsoft Azure 기능 활성화
컨트롤 플레인 머신 세트의 구성을 변경하여 컨트롤 플레인 머신에서 Microsoft Azure 기능을 활성화할 수 있습니다. 업데이트를 컨트롤 플레인 머신 세트에 저장하면 컨트롤 플레인 머신 세트 Operator가 구성된 업데이트 전략에 따라 컨트롤 플레인 시스템을 업데이트합니다.
12.4.4.1. API 서버를 프라이빗으로 제한
Microsoft Azure에 클러스터를 배포한 후 프라이빗 영역만 사용하도록 API 서버를 재구성할 수 있습니다.
사전 요구 사항
-
OpenShift CLI (
oc
)를 설치합니다. -
admin
권한이 있는 사용자로 웹 콘솔에 액세스합니다.
프로세스
클라우드 공급자의 웹 포털 또는 콘솔에서 다음 작업을 수행합니다.
적절한 로드 밸런서 구성 요소를 찾아 삭제합니다.
-
Azure의 경우 로드 밸런서의
api-internal
규칙을 삭제합니다.
-
Azure의 경우 로드 밸런서의
-
퍼블릭 영역의
api.$clustername.$yourdomain
DNS 항목을 삭제합니다.
컨트롤 플레인 머신 세트 사용자 정의 리소스에서 다음 행을 삭제하여 외부 로드 밸런서를 제거합니다.
providerSpec: value: loadBalancers: - name: lk4pj-ext 1 type: network 2 - name: lk4pj-int type: network
12.4.4.2. Azure Marketplace 이미지 선택
Azure에서 실행되는 머신 세트를 생성하여 Azure Marketplace 오퍼링을 사용하는 머신을 배포할 수 있습니다. 이 서비스를 사용하려면 먼저 Azure Marketplace 이미지를 가져와야 합니다. 이미지를 가져올 때 다음 사항을 고려하십시오.
-
이미지는 동일하지만 Azure Marketplace 게시자는 해당 지역에 따라 다릅니다. 북미에 있는 경우 게시자로
redhat
을 지정합니다. EMEA에 있는 경우 게시자로redhat-limited
를 지정합니다. -
이 제안에는
rh-ocp-worker
SKU 및rh-ocp-worker-gen1
SKU가 포함되어 있습니다.rh-ocp-worker
SKU는 Hyper-V 생성 버전 2 VM 이미지를 나타냅니다. OpenShift Container Platform에 사용되는 기본 인스턴스 유형은 버전 2와 호환됩니다. 버전 1과 호환되는 인스턴스 유형을 사용하려는 경우rh-ocp-worker-gen1
SKU와 연결된 이미지를 사용합니다.rh-ocp-worker-gen1
SKU는 Hyper-V 버전 1 VM 이미지를 나타냅니다.
Azure Marketplace를 사용하여 이미지를 설치하는 것은 64비트 ARM 인스턴스가 있는 클러스터에서는 지원되지 않습니다.
사전 요구 사항
-
Azure CLI 클라이언트
(az)
를 설치했습니다. - Azure 계정은 해당 오퍼를 사용할 수 있으며 Azure CLI 클라이언트를 사용하여 이 계정에 로그인했습니다.
프로세스
다음 명령 중 하나를 실행하여 사용 가능한 OpenShift Container Platform 이미지를 모두 표시합니다.
북아메리카:
$ az vm image list --all --offer rh-ocp-worker --publisher redhat -o table
출력 예
Offer Publisher Sku Urn Version ------------- -------------- ------------------ -------------------------------------------------------------- -------------- rh-ocp-worker RedHat rh-ocp-worker RedHat:rh-ocp-worker:rh-ocpworker:4.8.2021122100 4.8.2021122100 rh-ocp-worker RedHat rh-ocp-worker-gen1 RedHat:rh-ocp-worker:rh-ocp-worker-gen1:4.8.2021122100 4.8.2021122100
EMEA:
$ az vm image list --all --offer rh-ocp-worker --publisher redhat-limited -o table
출력 예
Offer Publisher Sku Urn Version ------------- -------------- ------------------ -------------------------------------------------------------- -------------- rh-ocp-worker redhat-limited rh-ocp-worker redhat-limited:rh-ocp-worker:rh-ocp-worker:4.8.2021122100 4.8.2021122100 rh-ocp-worker redhat-limited rh-ocp-worker-gen1 redhat-limited:rh-ocp-worker:rh-ocp-worker-gen1:4.8.2021122100 4.8.2021122100
참고설치하는 OpenShift Container Platform 버전에 관계없이 사용할 Azure Marketplace 이미지의 올바른 버전은 4.8입니다. 필요한 경우 설치 프로세스의 일부로 VM이 자동으로 업그레이드됩니다.
다음 명령 중 하나를 실행하여 제공 이미지를 검사합니다.
북아메리카:
$ az vm image show --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image show --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
다음 명령 중 하나를 실행하여 제안 조건을 검토합니다.
북아메리카:
$ az vm image terms show --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image terms show --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
다음 명령 중 하나를 실행하여 제공 조건을 수락합니다.
북아메리카:
$ az vm image terms accept --urn redhat:rh-ocp-worker:rh-ocp-worker:<version>
EMEA:
$ az vm image terms accept --urn redhat-limited:rh-ocp-worker:rh-ocp-worker:<version>
-
제공 사항의 이미지 세부 정보, 특히
게시자
,제공
값, 스쿠및
버전
. 제공 이미지 세부 정보를 사용하여 머신 세트 YAML 파일의
providerSpec
섹션에 다음 매개변수를 추가합니다.Azure Marketplace 머신의
providerSpec
이미지 값 샘플providerSpec: value: image: offer: rh-ocp-worker publisher: redhat resourceID: "" sku: rh-ocp-worker type: MarketplaceWithPlan version: 4.8.2021122100
12.4.4.3. Azure 부팅 진단 활성화
머신 세트가 생성하는 Azure 머신에서 부팅 진단을 활성화할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure 클러스터가 있어야 합니다.
프로세스
머신 세트 YAML 파일의
providerSpec
필드에 스토리지 유형에 적용할 수 있는진단
구성을 추가합니다.Azure Managed 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: AzureManaged 1
- 1
- Azure Managed 스토리지 계정을 지정합니다.
Azure Unmanaged 스토리지 계정의 경우:
providerSpec: diagnostics: boot: storageAccountType: CustomerManaged 1 customerManaged: storageAccountURI: https://<storage-account>.blob.core.windows.net 2
참고Azure Blob Storage 데이터 서비스만 지원됩니다.
검증
- Microsoft Azure 포털에서 머신 세트에서 배포한 머신의 부팅 진단 페이지를 검토하고 머신의 직렬 로그를 확인할 수 있는지 확인합니다.
12.4.4.4. 울트라 디스크가 있는 머신을 데이터 디스크로 배포하는 머신 세트
Azure에서 실행되는 머신 세트를 생성하여 경미한 디스크가 있는 머신을 배포할 수 있습니다. Ultra 디스크는 가장 엄격한 데이터 워크로드와 함께 사용하도록 설계된 고성능 스토리지입니다.
추가 리소스
12.4.4.4.1. 머신 세트를 사용하여 무기 디스크로 머신 생성
머신 세트 YAML 파일을 편집하여 Azure에 simple 디스크가 있는 머신을 배포할 수 있습니다.
사전 요구 사항
- 기존 Microsoft Azure 클러스터가 있어야 합니다.
프로세스
다음 명령을 실행하여
마스터
데이터 시크릿을 사용하여openshift-machine-api
네임스페이스에 사용자 지정 보안을 생성합니다.$ oc -n openshift-machine-api \ get secret <role>-user-data \ 1 --template='{{index .data.userData | base64decode}}' | jq > userData.txt 2
텍스트 편집기에서
userData.txt
파일을 열고 파일에서 최종}
문자를 찾습니다.-
바로 위의 줄에서
,
을 추가합니다. 뒤에 새 행을 생성하고 다음 구성 세부 정보를 추가합니다.
"storage": { "disks": [ 1 { "device": "/dev/disk/azure/scsi1/lun0", 2 "partitions": [ 3 { "label": "lun0p1", 4 "sizeMiB": 1024, 5 "startMiB": 0 } ] } ], "filesystems": [ 6 { "device": "/dev/disk/by-partlabel/lun0p1", "format": "xfs", "path": "/var/lib/lun0p1" } ] }, "systemd": { "units": [ 7 { "contents": "[Unit]\nBefore=local-fs.target\n[Mount]\nWhere=/var/lib/lun0p1\nWhat=/dev/disk/by-partlabel/lun0p1\nOptions=defaults,pquota\n[Install]\nWantedBy=local-fs.target\n", 8 "enabled": true, "name": "var-lib-lun0p1.mount" } ] }
- 1
- 노드에 연결할 디스크에 대한 구성 세부 정보입니다.
- 2
- 사용 중인 머신 세트의
dataDisks
스탠자에 정의된lun
값을 지정합니다. 예를 들어 시스템 세트에lun: 0
이 포함된 경우lun0
을 지정합니다. 이 구성 파일에서 여러 "디스크"
항목을 지정하여 여러 데이터 디스크를 초기화할 수 있습니다. 여러 개의"디스크"
항목을 지정하는 경우 시스템 세트의 각 파일에 대한lun
값이 일치하는지 확인합니다. - 3
- 디스크의 새 파티션에 대한 구성 세부 정보입니다.
- 4
- 파티션의 레이블을 지정합니다.
lun0
의 첫 번째 파티션에lun0p1
과 같은 계층적 이름을 사용하는 것이 유용할 수 있습니다. - 5
- 파티션의 총 크기를 MiB로 지정합니다.
- 6
- 파티션을 포맷할 때 사용할 파일 시스템을 지정합니다. 파티션 레이블을 사용하여 파티션을 지정합니다.
- 7
- 부팅 시 파티션을 마운트할
systemd
장치를 지정합니다. 파티션 레이블을 사용하여 파티션을 지정합니다. 이 구성 파일에 여러 개의"파티션"
항목을 지정하여 여러 파티션을 생성할 수 있습니다. 여러 개의"파티션"
항목을 지정하는 경우 각각에 대해systemd
장치를 지정해야 합니다. - 8
Where
.filesystems.path
의 값을 지정합니다.What
?에 대해storage.filesystems.device
의 값을 지정합니다.
-
바로 위의 줄에서
다음 명령을 실행하여
disableTemplating.txt
라는 파일에 disabling template 값을 추출합니다.$ oc -n openshift-machine-api get secret <role>-user-data \ 1 --template='{{index .data.disableTemplating | base64decode}}' | jq > disableTemplating.txt
- 1
- <
;role>
을master
로 바꿉니다.
userData.txt
파일을 결합하고Templating.txt 파일을 비활성화
하여 다음 명령을 실행하여 데이터 시크릿 파일을 생성합니다.$ oc -n openshift-machine-api create secret generic <role>-user-data-x5 \ 1 --from-file=userData=userData.txt \ --from-file=disableTemplating=disableTemplating.txt
- 1
- &
lt;role>-user-data-x5
의 경우 시크릿 이름을 지정합니다. <role>
을master
로 바꿉니다.
다음 명령을 실행하여 컨트롤 플레인 머신 세트 CR을 편집합니다.
$ oc --namespace openshift-machine-api edit controlplanemachineset.machine.openshift.io cluster
표시된 위치에 다음 행을 추가합니다.
apiVersion: machine.openshift.io/v1beta1 kind: ControlPlaneMachineSet spec: template: spec: metadata: labels: disk: ultrassd 1 providerSpec: value: ultraSSDCapability: Enabled 2 dataDisks: 3 - nameSuffix: ultrassd lun: 0 diskSizeGB: 4 deletionPolicy: Delete cachingType: None managedDisk: storageAccountType: UltraSSD_LRS userDataSecret: name: <role>-user-data-x5 4
변경 사항을 저장하십시오.
-
기본
RollingUpdate
업데이트 전략을 사용하는 클러스터의 경우 Operator는 변경 사항을 컨트롤 플레인 구성에 자동으로 전파합니다. -
OnDelete
업데이트 전략을 사용하도록 구성된 클러스터의 경우 컨트롤 플레인 시스템을 수동으로 교체해야 합니다.
-
기본
검증
다음 명령을 실행하여 시스템이 생성되었는지 확인합니다.
$ oc get machines
시스템이
Running
상태에 있어야 합니다.실행 중이고 노드가 연결된 머신의 경우 다음 명령을 실행하여 파티션을 검증합니다.
$ oc debug node/<node-name> -- chroot /host lsblk
이 명령에서
oc debug node/<node-name
>은 <node-name
> 노드에서 디버깅 쉘을 시작하고--
를 사용하여 명령을 전달합니다. 전달된 명령chroot /host
는 기본 호스트 OS 바이너리에 대한 액세스를 제공하며lsblk
는 호스트 OS 시스템에 연결된 블록 장치를 보여줍니다.
다음 단계
- 컨트롤 플레인에서 경미한 디스크를 사용하려면 컨트롤 플레인의 디스크 마운트 지점을 사용하도록 워크로드를 재구성하십시오.
12.4.4.4.2. 경미한 디스크를 활성화하는 머신 세트의 리소스 문제 해결
이 섹션의 정보를 사용하여 발생할 수 있는 문제를 이해하고 복구합니다.
12.4.4.4.2.1. 잘못된 디스크 구성
시스템 세트에 FCP Capability
매개변수의 잘못된 구성이 지정되면 머신 프로비저닝이 실패합니다.
예를 들어, Restic SSDCapability
매개변수가 Disabled
로 설정되어 있지만 dataDisks
매개변수에 영구 디스크가 지정된 경우 다음과 같은 오류 메시지가 표시됩니다.
StorageAccountType UltraSSD_LRS can be used only when additionalCapabilities.ultraSSDEnabled is set.
- 이 문제를 해결하려면 머신 세트 구성이 올바른지 확인합니다.
12.4.4.4.2.2. 지원되지 않는 디스크 매개변수
자명 디스크와 호환되지 않는 리전, 가용성 영역 또는 인스턴스 크기가 머신 세트에 지정되면 머신 프로비저닝이 실패합니다. 다음 오류 메시지에 대한 로그를 확인합니다.
failed to create vm <machine_name>: failure sending request for machine <machine_name>: cannot create vm: compute.VirtualMachinesClient#CreateOrUpdate: Failure sending request: StatusCode=400 -- Original Error: Code="BadRequest" Message="Storage Account type 'UltraSSD_LRS' is not supported <more_information_about_why>."
- 이 문제를 해결하려면 지원되는 환경에서 이 기능을 사용하고 있고 머신 세트 구성이 올바른지 확인합니다.
12.4.4.4.2.3. 디스크를 삭제할 수 없음
데이터 디스크가 예상대로 작동하지 않기 때문에 경미한 디스크를 삭제하면 머신이 삭제되고 데이터 디스크가 분리됩니다. 필요한 경우 고립된 디스크를 수동으로 삭제해야 합니다.
12.4.4.5. 머신 세트의 고객 관리 암호화 키 활성화
Azure에 암호화 키를 제공하여 관리 대상 디스크의 데이터를 암호화할 수 있습니다. 시스템 API를 사용하여 고객 관리 키로 서버 측 암호화를 활성화할 수 있습니다.
고객 관리 키를 사용하려면 Azure Key Vault, 디스크 암호화 세트 및 암호화 키가 필요합니다. 디스크 암호화 세트는 CCO(Cloud Credential Operator)에서 권한을 부여한 리소스 그룹에 있어야 합니다. 그렇지 않은 경우 디스크 암호화 세트에 추가 reader 역할을 부여해야 합니다.
프로세스
머신 세트 YAML 파일의
providerSpec
필드에 설정된 디스크 암호화를 구성합니다. 예를 들면 다음과 같습니다.providerSpec: value: osDisk: diskSizeGB: 128 managedDisk: diskEncryptionSet: id: /subscriptions/<subscription_id>/resourceGroups/<resource_group_name>/providers/Microsoft.Compute/diskEncryptionSets/<disk_encryption_set_name> storageAccountType: Premium_LRS
추가 리소스
12.4.4.6. Microsoft Azure VM용 네트워킹 가속화
빠른 네트워킹은 단일 루트 I/O 가상화(SR-IOV)를 사용하여 Microsoft Azure VM에 스위치에 더 직접적인 경로를 제공합니다. 이를 통해 네트워크 성능이 향상됩니다. 이 기능은 설치 후 활성화할 수 있습니다.
12.4.4.6.1. 제한
Accelerated Networking을 사용할지 여부를 결정할 때 다음과 같은 제한 사항을 고려하십시오.
- 빠른 네트워킹은 머신 API가 작동하는 클러스터에서만 지원됩니다.
빠른 네트워킹에는 최소 4개의 vCPU가 포함된 Azure VM 크기가 필요합니다. 이 요구 사항을 충족하기 위해 머신 세트의
vmSize
값을 변경할 수 있습니다. Azure VM 크기에 대한 자세한 내용은 Microsoft Azure 설명서를 참조하십시오.
12.4.4.6.2. 기존 Microsoft Azure 클러스터에서 가속 네트워킹 활성화
머신 세트 YAML 파일에 acceleratedNetworking
을 추가하여 Azure에서 Accelerated Networking을 활성화할 수 있습니다.
사전 요구 사항
- 머신 API가 작동하는 기존 Microsoft Azure 클러스터가 있어야 합니다.
프로세스
providerSpec
필드에 다음을 추가합니다.providerSpec: value: acceleratedNetworking: true 1 vmSize: <azure-vm-size> 2
- 1
- 이 라인은 가속 네트워킹을 활성화합니다.
- 2
- vCPU가 4개 이상인 Azure VM 크기를 지정합니다. VM 크기에 대한 자세한 내용은 Microsoft Azure 설명서를 참조하십시오.
검증
-
Microsoft Azure 포털에서 머신 세트에서 프로비저닝한 머신의 네트워킹 설정 페이지를 검토하고
가속 네트워킹
필드가Enabled
로 설정되어 있는지 확인합니다.
12.4.5. 컨트롤 플레인 시스템에 Google Cloud Platform 기능 활성화
컨트롤 플레인 머신 세트의 구성을 변경하여 컨트롤 플레인 시스템에서 GCP(Google Cloud Platform) 기능을 활성화할 수 있습니다. 업데이트를 컨트롤 플레인 머신 세트에 저장하면 컨트롤 플레인 머신 세트 Operator가 구성된 업데이트 전략에 따라 컨트롤 플레인 시스템을 업데이트합니다.
12.4.5.1. 머신 세트를 사용하여 영구 디스크 유형 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 머신을 배포하는 영구 디스크의 유형을 구성할 수 있습니다.
영구 디스크 유형, 호환성, 지역 가용성 및 제한 사항에 대한 자세한 내용은 영구 디스크에 대한 GCP Compute Engine 설명서를 참조하십시오.
프로세스
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드 아래에 다음 행을 편집합니다.apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet ... spec: template: spec: providerSpec: value: disks: type: pd-ssd 1
- 1
- 컨트롤 플레인 노드는
pd-ssd
디스크 유형을 사용해야 합니다.
검증
-
Google Cloud 콘솔을 사용하여 머신 세트에서 배포한 시스템의 세부 정보를 검토하고
Type
필드가 구성된 디스크 유형과 일치하는지 확인합니다.
12.4.5.2. 머신 세트를 사용하여 기밀성 VM 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 배포된 머신에 사용하는 기밀성 VM 옵션을 구성할 수 있습니다.
기밀성 컴퓨팅 기능, 기능 및 호환성에 대한 자세한 내용은 기밀성 VM에 대한 GCP Compute Engine 설명서를 참조하십시오.
기밀 컴퓨팅은 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
프로세스
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드에서 다음 섹션을 편집합니다.apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet ... spec: template: spec: providerSpec: value: confidentialCompute: Enabled 1 onHostMaintenance: Terminate 2 machineType: n2d-standard-8 3 ...
검증
- Google Cloud 콘솔에서 머신 세트에서 배포한 머신의 세부 정보를 검토하고 기밀성 VM 옵션이 구성한 값과 일치하는지 확인합니다.
12.4.5.3. 머신 세트를 사용하여 Shielded VM 옵션 구성
머신 세트 YAML 파일을 편집하여 머신 세트가 배포된 머신에 사용하는 Shielded VM 옵션을 구성할 수 있습니다.
Shielded VM 기능 및 기능에 대한 자세한 내용은 Shielded VM 에 대한 GCP Compute Engine 설명서를 참조하십시오.
절차
- 텍스트 편집기에서 기존 머신 세트의 YAML 파일을 열거나 새 파일을 생성합니다.
providerSpec
필드에서 다음 섹션을 편집합니다.apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet ... spec: template: spec: providerSpec: value: shieldedInstanceConfig: 1 integrityMonitoring: Enabled 2 secureBoot: Disabled 3 virtualizedTrustedPlatformModule: Enabled 4 ...
검증
- Google Cloud 콘솔을 사용하여 머신 세트에서 배포한 머신의 세부 정보를 검토하고 중지된 VM 옵션이 구성한 값과 일치하는지 확인합니다.
12.4.5.4. 머신 세트의 고객 관리 암호화 키 활성화
GCP(Google Cloud Platform) Compute Engine을 사용하면 사용자가 암호화 키를 제공하여 디스크의 데이터를 암호화 할 수 있습니다. 키는 고객의 데이터를 암호화하는 것이 아니라 데이터 암호화 키를 암호화하는 데 사용됩니다. 기본적으로 Compute Engine은 Compute Engine 키를 사용하여 이 데이터를 암호화합니다.
Machine API를 사용하는 클러스터에서 고객 관리 키로 암호화를 활성화할 수 있습니다. 먼저 KMS 키를 생성하고 서비스 계정에 올바른 권한을 할당해야 합니다. 서비스 계정에서 키를 사용하려면 KMS 키 이름, 키 링 이름 및 위치가 필요합니다.
KMS 암호화에 전용 서비스 계정을 사용하지 않는 경우 Compute Engine 기본 서비스 계정이 대신 사용됩니다. 전용 서비스 계정을 사용하지 않는 경우 키에 액세스할 수 있는 기본 서비스 계정 권한을 부여해야 합니다. Compute Engine 기본 서비스 계정 이름은 service-<project_number>@compute-system.iam.gserviceaccount.com
패턴을 기반으로 합니다.
절차
특정 서비스 계정에서 KMS 키를 사용하고 서비스 계정에 올바른 IAM 역할을 부여하려면 KMS 키 이름, 키 링 이름 및 위치로 다음 명령을 실행합니다.
$ gcloud kms keys add-iam-policy-binding <key_name> \ --keyring <key_ring_name> \ --location <key_ring_location> \ --member "serviceAccount:service-<project_number>@compute-system.iam.gserviceaccount.com” \ --role roles/cloudkms.cryptoKeyEncrypterDecrypter
사용자가 머신 세트 YAML 파일의
providerSpec
필드에 암호화 키를 구성할 수 있습니다. 예를 들면 다음과 같습니다.apiVersion: machine.openshift.io/v1 kind: ControlPlaneMachineSet ... spec: template: spec: providerSpec: value: disks: - type: encryptionKey: kmsKey: name: machine-encryption-key 1 keyRing: openshift-encrpytion-ring 2 location: global 3 projectID: openshift-gcp-project 4 kmsKeyServiceAccount: openshift-service-account@openshift-gcp-project.iam.gserviceaccount.com 5
업데이트된
providerSpec
오브젝트 구성을 사용하여 새 머신을 생성하면 디스크 암호화 키가 KMS 키로 암호화됩니다.
12.5. 컨트롤 플레인 복구 및 복구
컨트롤 플레인 머신 세트를 사용하여 OpenShift Container Platform 클러스터의 컨트롤 플레인의 복원력을 개선할 수 있습니다.
12.5.1. 장애 도메인을 통한 고가용성 및 내결함성
가능한 경우 컨트롤 플레인 머신 세트는 컨트롤 플레인 시스템을 여러 장애 도메인에 분배합니다. 이 구성은 컨트롤 플레인 내에서 고가용성 및 내결함성을 제공합니다. 이 전략은 인프라 공급자 내에서 문제가 발생할 때 컨트롤 플레인을 보호하는 데 도움이 될 수 있습니다.
12.5.1.1. 장애 도메인 플랫폼 지원 및 구성
장애 도메인의 컨트롤 플레인 머신 세트는 클라우드 공급자의 기존 개념과 유사합니다. 모든 플랫폼이 실패 도메인 사용을 지원하는 것은 아닙니다.
클라우드 공급자 | 실패 도메인 지원 | 공급자 nomenclature |
---|---|---|
AWS(Amazon Web Services) | X | |
GCP(Google Cloud Platform) | X | |
Microsoft Azure | X | |
VMware vSphere | 해당 없음 |
컨트롤 플레인 머신 세트 CR(사용자 정의 리소스)의 실패 도메인 구성은 플랫폼에 따라 다릅니다. CR의 실패 도메인 매개변수에 대한 자세한 내용은 공급자의 샘플 실패 도메인 구성을 참조하십시오.
12.5.1.2. 컨트롤 플레인 시스템 밸런싱
컨트롤 플레인 머신 세트는 CR(사용자 정의 리소스)에 지정된 실패 도메인에서 컨트롤 플레인 시스템을 조정합니다.
가능한 경우 컨트롤 플레인 머신 세트는 각 장애 도메인을 동일하게 사용하여 적절한 내결함성을 보장합니다. 컨트롤 플레인 시스템보다 실패 도메인이 적은 경우 이름별로 알파벳순으로 재사용할 수 있도록 실패 도메인이 선택됩니다. 장애 도메인이 지정되지 않은 클러스터의 경우 모든 컨트롤 플레인 시스템이 단일 장애 도메인 내에 배치됩니다.
장애 도메인 구성을 변경하면 컨트롤 플레인 시스템이 컨트롤 플레인 시스템을 재조정합니다. 예를 들어 컨트롤 플레인 시스템보다 장애 도메인이 적은 클러스터에 실패 도메인을 추가하는 경우 컨트롤 플레인 머신 세트는 사용 가능한 모든 장애 도메인에서 머신을 재조정합니다.
12.5.2. 실패한 컨트롤 플레인 시스템 복구
컨트롤 플레인 머신 세트 Operator는 컨트롤 플레인 시스템의 복구를 자동화합니다. 컨트롤 플레인 머신이 삭제되면 Operator는 ControlPlaneMachineSet
CR(사용자 정의 리소스)에 지정된 구성으로 교체를 생성합니다.
컨트롤 플레인 머신 세트를 사용하는 클러스터의 경우 머신 상태 점검을 구성할 수 있습니다. 머신 상태 점검은 비정상적인 컨트롤 플레인 머신을 삭제하여 교체됩니다.
컨트롤 플레인에 대해 MachineHealthCheck
리소스를 구성하는 경우 maxUnhealthy
값을 1
로 설정합니다.
이 구성을 사용하면 여러 컨트롤 플레인 머신이 비정상으로 표시되면 머신 상태 점검이 수행되지 않습니다. 비정상적인 여러 컨트롤 플레인 시스템은 etcd 클러스터의 성능이 저하되었거나 실패한 머신을 교체하는 확장 작업이 진행 중임을 나타낼 수 있습니다.
etcd 클러스터가 성능이 저하되면 수동 개입이 필요할 수 있습니다. 스케일링 작업이 진행 중인 경우 머신 상태 점검을 통해 완료할 수 있어야 합니다.
추가 리소스
12.5.3. 머신 라이프사이클 후크를 통한 쿼럼 보호
Machine API Operator를 사용하는 OpenShift Container Platform 클러스터의 경우 etcd Operator는 머신 삭제 단계에 라이프사이클 후크를 사용하여 쿼럼 보호 메커니즘을 구현합니다.
preDrain
라이프사이클 후크를 사용하면 etcd Operator에서 컨트롤 플레인 시스템의 pod가 드레이닝 및 제거되는 시기를 제어할 수 있습니다. etcd 쿼럼을 보호하기 위해 etcd Operator는 해당 멤버를 클러스터 내의 새 노드로 마이그레이션할 때까지 etcd 멤버를 제거할 수 있습니다.
이 메커니즘을 통해 etcd Operator는 etcd 쿼럼의 멤버를 정확하게 제어할 수 있으며 Machine API Operator는 etcd 클러스터에 대한 특정 운영 지식 없이도 컨트롤 플레인 머신을 안전하게 생성 및 제거할 수 있습니다.
12.5.3.1. 쿼럼 보호 처리 순서를 사용한 컨트롤 플레인 삭제
컨트롤 플레인 머신 세트를 사용하는 클러스터에서 컨트롤 플레인 머신이 교체되면 클러스터에 4개의 컨트롤 플레인 시스템이 일시적으로 부여됩니다. 네 번째 컨트롤 플레인 노드가 클러스터에 참여하면 etcd Operator는 교체 노드에서 새 etcd 멤버를 시작합니다. etcd Operator는 이전 컨트롤 플레인 머신이 삭제로 표시된 것을 관찰하면 이전 노드에서 etcd 멤버를 중지하고 대체 etcd 멤버를 승격하여 클러스터의 쿼럼에 참여하도록 합니다.
컨트롤 플레인 머신 삭제
단계는 다음 순서로 진행됩니다.
- 컨트롤 플레인 시스템이 삭제될 예정입니다.
-
컨트롤 플레인 시스템이
삭제
단계에 들어갑니다. preDrain
라이프사이클 후크를 충족하기 위해 etcd Operator는 다음 작업을 수행합니다.-
etcd Operator는 중단된 컨트롤 플레인 시스템이 etcd 멤버로 클러스터에 추가될 때까지 기다립니다. 이 새 etcd 멤버는
Running
이지만 etcd 리더에서 전체 데이터베이스 업데이트를 수신할 때까지 준비되지
않았습니다. - 새 etcd 멤버가 전체 데이터베이스 업데이트를 수신하면 etcd Operator는 새 etcd 멤버를 투표 멤버로 승격하고 클러스터에서 이전 etcd 멤버를 제거합니다.
이 전환이 완료되면 이전 etcd pod 및 해당 데이터를 제거할 수 있으므로
preDrain
라이프사이클 후크가 제거됩니다.-
etcd Operator는 중단된 컨트롤 플레인 시스템이 etcd 멤버로 클러스터에 추가될 때까지 기다립니다. 이 새 etcd 멤버는
-
컨트롤 플레인 머신 상태 조건
Drainable
은True
로 설정됩니다. 머신 컨트롤러는 컨트롤 플레인 머신에서 지원하는 노드를 드레이닝하려고 합니다.
-
드레인링에 실패하면
Drained
가False
로 설정되고 머신 컨트롤러에서 노드를 다시 드레이닝하려고 합니다. -
드레인링에 성공하면
Drained
가True
로 설정됩니다.
-
드레인링에 실패하면
-
컨트롤 플레인 시스템 상태
조건이
True
로 설정됩니다. -
다른 Operator에
preTerminate
라이프사이클 후크를 추가하지 않은 경우 컨트롤 플레인 머신 상태 조건Terminable
이True
로 설정됩니다. - 머신 컨트롤러는 인프라 공급자에서 인스턴스를 제거합니다.
-
머신 컨트롤러는
Node
오브젝트를 삭제합니다.
etcd 쿼럼 보호 preDrain
라이프사이클 후크를 보여주는 YAML 스니펫
apiVersion: machine.openshift.io/v1beta1 kind: Machine metadata: ... spec: lifecycleHooks: preDrain: - name: EtcdQuorumOperator 1 owner: clusteroperator/etcd 2 ...
추가 리소스
12.6. 컨트롤 플레인 머신 세트 문제 해결
이 섹션의 정보를 사용하여 발생할 수 있는 문제를 이해하고 복구합니다.
12.6.1. 컨트롤 플레인 시스템 세트 사용자 정의 리소스 상태 확인
ControlPlaneMachineSet
CR(사용자 정의 리소스)의 존재 및 상태를 확인할 수 있습니다.
절차
다음 명령을 실행하여 CR의 상태를 확인합니다.
$ oc get controlplanemachineset.machine.openshift.io cluster \ --namespace openshift-machine-api
-
Active
의 결과는ControlPlaneMachineSet
CR이 존재하고 활성화되어 있음을 나타냅니다. 관리자 작업이 필요하지 않습니다. -
비활성
결과는ControlPlaneMachineSet
CR이 존재하지만 활성화되지 않음을 나타냅니다. -
NotFound
의 결과는ControlPlaneMachineSet
CR이 없음을 나타냅니다.
-
다음 단계
컨트롤 플레인 머신 세트를 사용하려면 클러스터에 대한 올바른 설정이 있는 ControlPlaneMachineSet
CR이 있는지 확인해야 합니다.
- 클러스터에 기존 CR이 있는 경우 CR의 구성이 클러스터에 적합한지 확인해야 합니다.
- 클러스터에 기존 CR이 없는 경우 클러스터에 대한 올바른 구성으로 클러스터를 생성해야 합니다.
12.6.2. 누락된 Azure 내부 로드 밸런서 추가
internalLoadBalancer
매개변수는 Azure의 ControlPlane
및 컨트롤 플레인 머신 사용자 정의 리소스(CR) 모두에 필요합니다. 이 매개변수가 클러스터에서 사전 구성되지 않은 경우 두 CR 모두에 추가해야 합니다.
Machine
Set
이 매개 변수가 Azure 공급자 사양에 있는 위치에 대한 자세한 내용은 샘플 Azure 공급자 사양을 참조하십시오. 컨트롤 플레인 머신
CR의 배치는 비슷합니다.
절차
다음 명령을 실행하여 클러스터의 컨트롤 플레인 시스템을 나열합니다.
$ oc get machines \ -l machine.openshift.io/cluster-api-machine-role==master \ -n openshift-machine-api
각 컨트롤 플레인 머신에 대해 다음 명령을 실행하여 CR을 편집합니다.
$ oc edit machine <control_plane_machine_name>
-
클러스터에 대한 올바른 세부 정보와 함께
internalLoadBalancer
매개변수를 추가하고 변경 사항을 저장합니다. 다음 명령을 실행하여 컨트롤 플레인 머신 세트 CR을 편집합니다.
$ oc edit controlplanemachineset.machine.openshift.io cluster \ -n openshift-machine-api
-
클러스터에 대한 올바른 세부 정보와 함께
internalLoadBalancer
매개변수를 추가하고 변경 사항을 저장합니다.
다음 단계
-
기본
RollingUpdate
업데이트 전략을 사용하는 클러스터의 경우 Operator는 변경 사항을 컨트롤 플레인 구성에 자동으로 전파합니다. -
OnDelete
업데이트 전략을 사용하도록 구성된 클러스터의 경우 컨트롤 플레인 시스템을 수동으로 교체해야 합니다.
추가 리소스
12.6.3. 성능이 저하된 etcd Operator 복구
특정 상황으로 인해 etcd Operator의 성능이 저하될 수 있습니다.
예를 들어 수정을 수행하는 동안 머신 상태 점검에서 etcd를 호스팅하는 컨트롤 플레인 머신이 삭제될 수 있습니다. 현재 etcd 멤버에 연결할 수 없는 경우 etcd Operator의 성능이 저하됩니다.
etcd Operator가 성능이 저하되면 Operator에서 실패한 멤버를 제거하고 클러스터 상태를 복원하도록 수동 개입이 필요합니다.
절차
다음 명령을 실행하여 클러스터의 컨트롤 플레인 시스템을 나열합니다.
$ oc get machines \ -l machine.openshift.io/cluster-api-machine-role==master \ -n openshift-machine-api \ -o wide
다음 조건 중 하나라도 실패한 컨트롤 플레인 시스템을 나타낼 수 있습니다.
-
STATE
값이중지되었습니다
. -
PHASE
값은실패
입니다. -
PHASE
값은 10분
이상 삭제되어 있습니다.
중요계속하기 전에 클러스터에 두 개의 정상 컨트롤 플레인 시스템이 있는지 확인합니다. 두 개 이상의 컨트롤 플레인 시스템에서 이 프로세스의 작업을 수행하면 etcd 쿼럼이 손실될 위험이 있으며 데이터가 손실될 수 있습니다.
대부분의 컨트롤 플레인 호스트가 손실되고 etcd 쿼럼이 손실된 경우 이 절차 대신 재해 복구 프로세스 "이전 클러스터 상태로 복원"을 따라야 합니다.
-
다음 명령을 실행하여 실패한 컨트롤 플레인 머신의 머신 CR을 편집합니다.
$ oc edit machine <control_plane_machine_name>
실패한 컨트롤 플레인 시스템에서
lifecycleHooks
매개변수의 콘텐츠를 제거하고 변경 사항을 저장합니다.etcd Operator는 클러스터에서 실패한 머신을 제거한 다음 새 etcd 멤버를 안전하게 추가할 수 있습니다.
추가 리소스
12.7. 컨트롤 플레인 머신 세트 비활성화
활성화된 ControlPlaneMachineSet
CR(사용자 정의 리소스)의 .spec.state
필드를 활성
에서 비활성
으로 변경할 수 없습니다. 컨트롤 플레인 머신 세트를 비활성화하려면 클러스터에서 CR을 제거하도록 CR을 삭제해야 합니다.
CR을 삭제하면 컨트롤 플레인 머신 세트 Operator가 정리 작업을 수행하고 컨트롤 플레인 머신 세트를 비활성화합니다. 그런 다음 Operator는 클러스터에서 CR을 제거하고 기본 설정으로 비활성 컨트롤 플레인 머신 세트를 생성합니다.
12.7.1. 컨트롤 플레인 머신 세트 삭제
클러스터에서 컨트롤 플레인 머신 세트를 사용하여 컨트롤 플레인 시스템 관리를 중지하려면 ControlPlaneMachineSet
CR(사용자 정의 리소스)을 삭제해야 합니다.
절차
다음 명령을 실행하여 컨트롤 플레인 머신 세트 CR을 삭제합니다.
$ oc delete controlplanemachineset.machine.openshift.io cluster \ -n openshift-machine-api
검증
-
컨트롤 플레인 시스템 세트 사용자 정의 리소스 상태를 확인합니다.
비활성
결과는 제거 및 교체 프로세스가 성공했음을 나타냅니다.ControlPlaneMachineSet
CR이 있지만 활성화되지 않았습니다.
12.7.2. 컨트롤 플레인 시스템 세트 사용자 정의 리소스 상태 확인
ControlPlaneMachineSet
CR(사용자 정의 리소스)의 존재 및 상태를 확인할 수 있습니다.
절차
다음 명령을 실행하여 CR의 상태를 확인합니다.
$ oc get controlplanemachineset.machine.openshift.io cluster \ --namespace openshift-machine-api
-
Active
의 결과는ControlPlaneMachineSet
CR이 존재하고 활성화되어 있음을 나타냅니다. 관리자 작업이 필요하지 않습니다. -
비활성
결과는ControlPlaneMachineSet
CR이 존재하지만 활성화되지 않음을 나타냅니다. -
NotFound
의 결과는ControlPlaneMachineSet
CR이 없음을 나타냅니다.
-
12.7.3. 컨트롤 플레인 머신 세트 다시 활성화
컨트롤 플레인 머신 세트를 다시 활성화하려면 CR의 구성이 클러스터에 대한 올바른지 확인하고 활성화해야 합니다.
추가 리소스
13장. 클러스터 API를 사용하여 머신 관리
13.1. 클러스터 API 정보
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
Cluster API 는 OpenShift Container Platform에 AWS(Amazon Web Services) 및 GCP(Google Cloud Platform)의 기술 프리뷰로 통합된 업스트림 프로젝트입니다.
13.1.1. 클러스터 API 개요
Cluster API를 사용하여 OpenShift Container Platform 클러스터에서 컴퓨팅 머신 세트 및 컴퓨팅 머신을 생성하고 관리할 수 있습니다. 이 기능은 Machine API를 사용하여 머신 관리하는 것에 대한 대안이나 추가 기능입니다.
OpenShift Container Platform 4.13 클러스터의 경우 클러스터 API를 사용하여 클러스터 설치가 완료된 후 노드 호스트 프로비저닝 관리 작업을 수행할 수 있습니다. 이 시스템을 사용하면 퍼블릭 또는 프라이빗 클라우드 인프라에 더하여 탄력적이고 동적인 프로비저닝 방법을 사용할 수 있습니다.
Cluster API 기술 프리뷰를 사용하면 지원되는 공급자의 OpenShift Container Platform 클러스터에서 컴퓨팅 머신 및 컴퓨팅 머신 세트를 생성할 수 있습니다. Machine API에서 사용할 수 없는 이 구현에서 활성화된 기능을 확인할 수도 있습니다.
13.1.1.1. 클러스터 API의 이점
OpenShift Container Platform 사용자 및 개발자는 Cluster API를 사용하여 다음과 같은 이점을 얻을 수 있습니다.
- Machine API에서 지원하지 않을 수 있는 업스트림 커뮤니티 Cluster API 인프라 공급자를 사용하는 옵션입니다.
- 인프라 공급자를 위한 머신 컨트롤러를 유지 관리하는 타사와 협력할 수 있는 기회를 제공합니다.
- OpenShift Container Platform의 인프라 관리에 동일한 Kubernetes 툴 세트를 사용할 수 있습니다.
- Machine API에서 사용할 수 없는 기능을 지원하는 클러스터 API를 사용하여 컴퓨팅 머신 세트를 생성하는 기능입니다.
13.1.1.2. 클러스터 API 제한 사항
Cluster API를 사용하여 머신을 관리하는 것은 기술 프리뷰 기능으로 다음과 같은 제한 사항이 있습니다.
이 기능을 사용하려면
TechPreviewNoUpgrade
기능 세트를 활성화해야 합니다.중요이 기능 세트를 활성화하면 실행 취소할 수 없으며 마이너 버전 업데이트를 방지할 수 없습니다.
- AWS 및 GCP 클러스터만 클러스터 API를 사용할 수 있습니다.
- 클러스터 API에 필요한 기본 리소스를 수동으로 생성해야 합니다. 자세한 내용은 "Cluster API 시작하기"를 참조하십시오.
- 클러스터 API를 사용하여 컨트롤 플레인 시스템을 관리할 수 없습니다.
- Machine API에서 클러스터 API 컴퓨팅 머신 세트로 생성한 기존 컴퓨팅 머신 세트의 마이그레이션은 지원되지 않습니다.
- 머신 API와의 전체 기능 패리티를 사용할 수 없습니다.
Cluster API를 사용하는 클러스터의 경우 OpenShift CLI(
oc
) 명령은 Machine API 오브젝트를 통해 Cluster API 오브젝트를 우선시합니다. 이 동작은 Cluster API 및 Machine API 둘 다에 표시되는 모든 오브젝트에 대해 작동하는oc
명령에 영향을 미칩니다.자세한 내용 및 이 문제에 대한 해결 방법은 문제 해결 콘텐츠에서 "CLI를 사용할 때 의도한 오브젝트 참조"를 참조하십시오.
13.1.2. 클러스터 API 아키텍처
업스트림 Cluster API의 OpenShift Container Platform 통합은 Cluster CAPI Operator에 의해 구현 및 관리됩니다. Cluster CAPI Operator 및 해당 피연산자는 openshift-machine-api
네임스페이스를 사용하는 Machine API와 달리 openshift-cluster-api
네임스페이스에서 프로비저닝됩니다.
13.1.2.1. Cluster CAPI Operator
Cluster CAPI Operator는 Cluster API 리소스의 라이프사이클을 유지 관리하는 OpenShift Container Platform Operator입니다. 이 Operator는 OpenShift Container Platform 클러스터 내에 Cluster API 프로젝트를 배포하는 것과 관련된 모든 관리 작업을 담당합니다.
Cluster API를 사용할 수 있도록 클러스터가 올바르게 구성된 경우 Cluster CAPI Operator가 클러스터에 Cluster API Operator를 설치합니다.
Cluster CAPI Operator는 업스트림 Cluster API Operator와 다릅니다.
자세한 내용은 Cluster Operators 참조 콘텐츠의 "Cluster CAPI Operator" 항목을 참조하십시오.
추가 리소스
13.1.2.2. 클러스터 API 기본 리소스
Cluster API는 다음과 같은 기본 리소스로 구성됩니다. 이 기능의 기술 프리뷰의 경우 openshift-cluster-api
네임스페이스에서 이러한 리소스를 수동으로 생성해야 합니다.
- Cluster
- 클러스터 API에서 관리하는 클러스터를 나타내는 기본 단위입니다.
- 인프라
- 리전 및 서브넷과 같이 클러스터의 모든 컴퓨팅 머신 세트에서 공유하는 속성을 정의하는 공급자별 리소스입니다.
- 머신 템플릿
- 컴퓨팅 머신 세트가 생성하는 시스템의 속성을 정의하는 공급자별 템플릿입니다.
- 머신 세트
시스템 그룹입니다.
컴퓨팅 머신 세트는 머신에 연관되어 있으며 복제본 세트는 pod에 연관되어 있습니다. 머신을 추가하거나 축소하려면 컴퓨팅 요구 사항에 맞게 컴퓨팅 머신 세트 사용자 정의 리소스의
replicas
필드를 변경합니다.Cluster API를 사용하면 컴퓨팅 머신 세트가
Cluster
오브젝트와 공급자별 머신 템플릿을 참조합니다.- 머신
노드의 호스트를 설명하는 기본 단위입니다.
Cluster API는 머신 템플릿의 구성을 기반으로 머신을 생성합니다.
13.2. 클러스터 API 시작하기
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
Cluster API 기술 프리뷰의 경우 클러스터 API에 수동으로 필요한 기본 리소스를 생성해야 합니다.
13.2.1. Cluster API 기본 리소스 생성
Cluster API 기본 리소스를 생성하려면 클러스터 리소스 매니페스트에서 < cluster_name
> 매개변수에 사용하는 클러스터 ID 값을 가져와야 합니다.
13.2.1.1. 클러스터 ID 값 가져오기
OpenShift CLI(oc
)를 사용하여 클러스터 ID 값을 찾을 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다.
절차
다음 명령을 실행하여 클러스터 ID의 값을 가져옵니다.
$ oc get infrastructure cluster \ -o jsonpath='{.status.infrastructureName}'
YAML 매니페스트 파일을 생성하고 OpenShift CLI(oc
)로 적용하여 Cluster API 기본 리소스를 수동으로 생성할 수 있습니다.
13.2.1.2. Cluster API 클러스터 리소스 생성
YAML 매니페스트 파일을 생성하고 OpenShift CLI(oc
)로 적용하여 클러스터 리소스를 생성할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포했습니다.
- 클러스터 API 사용을 활성화했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다. - 클러스터 ID 값이 있습니다.
절차
다음과 유사한 YAML 파일을 생성합니다. 이 절차에서는 &
lt;cluster_resource_file>.yaml
을 예제 파일 이름으로 사용합니다.apiVersion: cluster.x-k8s.io/v1beta1 kind: Cluster metadata: name: <cluster_name> 1 namespace: openshift-cluster-api spec: infrastructureRef: apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: <infrastructure_kind> 2 name: <cluster_name> namespace: openshift-cluster-api
다음 명령을 실행하여 클러스터 CR을 생성합니다.
$ oc create -f <cluster_resource_file>.yaml
검증
다음 명령을 실행하여 클러스터 CR이 있는지 확인합니다.
$ oc get cluster
출력 예
NAME PHASE AGE VERSION <cluster_name> Provisioning 4h6m
PHASE
값이프로비저닝
되면 클러스터 리소스가 준비됩니다.
추가 리소스
13.2.1.3. 클러스터 API 인프라 리소스 생성
YAML 매니페스트 파일을 생성하고 OpenShift CLI(oc
)로 적용하여 공급자별 인프라 리소스를 생성할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포했습니다.
- 클러스터 API 사용을 활성화했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다. - 클러스터 ID 값이 있습니다.
- 클러스터 리소스를 생성하고 적용했습니다.
절차
다음과 유사한 YAML 파일을 생성합니다. 이 절차에서는 &
lt;infrastructure_resource_file>.yaml
을 예제 파일 이름으로 사용합니다.apiVersion: infrastructure.cluster.x-k8s.io/<version> 1 kind: <infrastructure_kind> 2 metadata: name: <cluster_name> 3 namespace: openshift-cluster-api spec: 4
- 1
apiVersion
은 플랫폼에 따라 다릅니다. 자세한 내용은 공급자의 샘플 Cluster API 인프라 리소스 YAML을 참조하십시오. 다음 값이 유효합니다.-
infrastructure.cluster.x-k8s.io/v1beta1
: GCP(Google Cloud Platform) 클러스터가 사용하는 버전입니다. -
infrastructure.cluster.x-k8s.io/v1beta1
: AWS(Amazon Web Services) 클러스터가 사용하는 버전입니다.
-
- 2
- 클러스터의 인프라 종류를 지정합니다. 이 값은 플랫폼 값과 일치해야 합니다. 다음 값이 유효합니다.
-
AWSCluster
: 클러스터가 AWS에서 실행되고 있습니다. -
GCPCluster
: 클러스터가 GCP에서 실행되고 있습니다.
-
- 3
- 클러스터 이름을 지정합니다.
- 4
- 환경에 대한 세부 정보를 지정합니다. 이러한 매개변수는 공급자별로 다릅니다. 자세한 내용은 공급자의 샘플 Cluster API 인프라 리소스 YAML을 참조하십시오.
다음 명령을 실행하여 infrastructure CR을 생성합니다.
$ oc create -f <infrastructure_resource_file>.yaml
검증
다음 명령을 실행하여 인프라 CR이 생성되었는지 확인합니다.
$ oc get <infrastructure_kind>
여기서
<infrastructure_kind
>는 플랫폼에 해당하는 값입니다.출력 예
NAME CLUSTER READY <cluster_name> <cluster_name> true
참고이 출력에는 클라우드 공급자와 관련된 추가 열이 포함될 수 있습니다.
13.2.1.4. 클러스터 API 머신 템플릿 생성
YAML 매니페스트 파일을 생성하고 OpenShift CLI(oc
)로 적용하여 공급자별 머신 템플릿 리소스를 생성할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포했습니다.
- 클러스터 API 사용을 활성화했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다. - 클러스터 및 인프라 리소스를 생성하고 적용했습니다.
절차
다음과 유사한 YAML 파일을 생성합니다. 이 절차에서는 &
lt;machine_template_resource_file>.yaml
을 예제 파일 이름으로 사용합니다.apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: <machine_template_kind> 1 metadata: name: <template_name> 2 namespace: openshift-cluster-api spec: template: spec: 3
다음 명령을 실행하여 머신 템플릿 CR을 생성합니다.
$ oc create -f <machine_template_resource_file>.yaml
검증
다음 명령을 실행하여 머신 템플릿 CR이 생성되었는지 확인합니다.
$ oc get <machine_template_kind>
여기서
<machine_template_kind
>는 플랫폼에 해당하는 값입니다.출력 예
NAME AGE <template_name> 77m
13.2.1.5. 클러스터 API 컴퓨팅 머신 세트 생성
Cluster API를 사용하여 선택한 특정 워크로드의 머신 컴퓨팅 리소스를 동적으로 관리하는 컴퓨팅 머신 세트를 생성할 수 있습니다.
사전 요구 사항
- OpenShift Container Platform 클러스터를 배포했습니다.
- 클러스터 API 사용을 활성화했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다. - 클러스터, 인프라 및 머신 템플릿 리소스를 생성했습니다.
절차
다음과 유사한 YAML 파일을 생성합니다. 이 절차에서는 &
lt;machine_set_resource_file>.yaml
을 예제 파일 이름으로 사용합니다.apiVersion: cluster.x-k8s.io/v1beta1 kind: MachineSet metadata: name: <machine_set_name> 1 namespace: openshift-cluster-api spec: clusterName: <cluster_name> 2 replicas: 1 selector: matchLabels: test: example template: metadata: labels: test: example spec: 3 # ...
다음 명령을 실행하여 컴퓨팅 머신 세트 CR을 생성합니다.
$ oc create -f <machine_set_resource_file>.yaml
다음 명령을 실행하여 컴퓨팅 머신 세트 CR이 생성되었는지 확인합니다.
$ oc get machineset -n openshift-cluster-api 1
- 1
openshift-cluster-api
네임스페이스를 지정합니다.
출력 예
NAME CLUSTER REPLICAS READY AVAILABLE AGE VERSION <machine_set_name> <cluster_name> 1 1 1 17m
새 컴퓨팅 머신 세트를 사용할 수 있으면
REPLICAS
및AVAILABLE
값이 일치합니다. 컴퓨팅 머신 세트를 사용할 수 없는 경우 몇 분 기다렸다가 명령을 다시 실행합니다.
검증
컴퓨팅 머신 세트가 필수 구성에 따라 시스템을 생성하고 있는지 확인하려면 다음 명령을 실행하여 클러스터의 시스템 및 노드 목록을 검토합니다.
클러스터 API 머신 목록을 확인합니다.
$ oc get machine -n openshift-cluster-api 1
- 1
openshift-cluster-api
네임스페이스를 지정합니다.
출력 예
NAME CLUSTER NODENAME PROVIDERID PHASE AGE VERSION <machine_set_name>-<string_id> <cluster_name> <ip_address>.<region>.compute.internal <provider_id> Running 8m23s
노드 목록을 확인합니다.
$ oc get node
출력 예
NAME STATUS ROLES AGE VERSION <ip_address_1>.<region>.compute.internal Ready worker 5h14m v1.28.5 <ip_address_2>.<region>.compute.internal Ready master 5h19m v1.28.5 <ip_address_3>.<region>.compute.internal Ready worker 7m v1.28.5
13.3. 클러스터 API를 사용하여 머신 관리
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
13.3.1. 클러스터 API 머신 템플릿 수정
YAML 매니페스트 파일을 수정하고 OpenShift CLI(oc
)로 적용하여 클러스터의 머신 템플릿 리소스를 업데이트할 수 있습니다.
사전 요구 사항
- 클러스터 API를 사용하는 OpenShift Container Platform 클러스터를 배포했습니다.
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다.
절차
다음 명령을 실행하여 클러스터의 머신 템플릿 리소스를 나열합니다.
$ oc get <machine_template_kind> 1
- 1
- 플랫폼에 해당하는 값을 지정합니다. 다음 값이 유효합니다.
-
AWSMachineTemplate
: 클러스터가 AWS(Amazon Web Services)에서 실행되고 있습니다. -
GCPMachineTemplate
: 클러스터가 GCP(Google Cloud Platform)에서 실행되고 있습니다.
-
출력 예
NAME AGE <template_name> 77m
다음 명령을 실행하여 편집할 수 있는 파일에 클러스터의 머신 템플릿 리소스를 작성합니다.
$ oc get <machine_template_kind> <template_name> -o yaml > <template_name>.yaml
여기서
<template_name
>은 클러스터의 머신 템플릿 리소스의 이름입니다.-
다른 이름으로 <
template_name>.yaml
파일의 사본을 만듭니다. 이 절차에서는 <modified_template_name>.yaml
을 예제 파일 이름으로 사용합니다. 텍스트 편집기를 사용하여 클러스터에 대해 업데이트된 머신 템플릿 리소스를 정의하는 <
modified_template_name>.yaml
파일을 변경합니다. 머신 템플릿 리소스를 편집할 때 다음을 관찰합니다.-
spec
스탠자의 매개변수는 공급자별로 다릅니다. 자세한 내용은 공급자의 샘플 Cluster API 머신 템플릿 YAML을 참조하십시오. 기존 값과 다른
metadata.name
매개변수에 값을 사용해야 합니다.중요이 템플릿을 참조하는 Cluster API 컴퓨팅 머신 세트의 경우 새 머신 템플릿 리소스의
metadata.name
값과 일치하도록spec.template.spec.infrastructureRef.name
매개변수를 업데이트해야 합니다.
-
다음 명령을 실행하여 머신 템플릿 CR을 적용합니다.
$ oc apply -f <modified_template_name>.yaml 1
- 1
- 편집된 YAML 파일을 새 이름으로 사용합니다.
다음 단계
-
이 템플릿을 참조하는 Cluster API 컴퓨팅 머신 세트의 경우 새 머신 템플릿 리소스의
metadata.name
값과 일치하도록spec.template.spec.infrastructureRef.name
매개변수를 업데이트합니다. 자세한 내용은 "CLI를 사용하여 설정된 컴퓨팅 머신 수정"을 참조하십시오.
13.3.2. CLI를 사용하여 컴퓨팅 머신 세트 수정
컴퓨팅 머신 세트의 구성을 수정한 다음 CLI를 사용하여 변경 사항을 클러스터의 머신에 전파할 수 있습니다.
컴퓨팅 머신 세트 구성을 업데이트하면 기능을 활성화하거나 생성하는 시스템의 속성을 변경할 수 있습니다. 컴퓨팅 머신 세트를 수정할 때 변경 사항은 업데이트된 MachineSet
CR(사용자 정의 리소스)을 저장한 후 생성된 컴퓨팅 머신에만 적용됩니다. 변경 사항은 기존 머신에는 영향을 미치지 않습니다.
기본 클라우드 공급자의 변경 사항은 Machine
또는 MachineSet
CR에 반영되지 않습니다. 클러스터 관리 인프라에서 인스턴스 구성을 조정하려면 클러스터 측 리소스를 사용합니다.
컴퓨팅 머신 세트를 스케일링하여 복제본 수를 두 배로 만든 다음 원래 복제본 수로 축소하여 업데이트된 구성을 반영하는 기존 머신을 새 시스템으로 교체할 수 있습니다.
다른 변경을 수행하지 않고 컴퓨팅 머신 세트를 확장해야하는 경우 머신을 삭제할 필요가 없습니다.
기본적으로 OpenShift Container Platform 라우터 Pod는 컴퓨팅 머신에 배포됩니다. 라우터는 웹 콘솔을 포함한 일부 클러스터 리소스에 액세스해야 하므로 먼저 라우터 Pod를 재배치하지 않는 한 컴퓨팅 머신 세트를 0
으로 스케일링하지 마십시오.
사전 요구 사항
- OpenShift Container Platform 클러스터는 클러스터 API를 사용합니다.
-
OpenShift CLI(
oc
)를 사용하여 관리자로 클러스터에 로그인했습니다.
절차
다음 명령을 실행하여 클러스터의 컴퓨팅 머신 세트를 나열합니다.
$ oc get machinesets.cluster.x-k8s.io -n openshift-cluster-api
출력 예
NAME CLUSTER REPLICAS READY AVAILABLE AGE VERSION <compute_machine_set_name_1> <cluster_name> 1 1 1 26m <compute_machine_set_name_2> <cluster_name> 1 1 1 26m
다음 명령을 실행하여 컴퓨팅 머신 세트를 편집합니다.
$ oc edit machinesets.cluster.x-k8s.io <machine_set_name> \ -n openshift-cluster-api
변경 사항을 적용하기 위해 머신 세트를 스케일링할 때 필요하므로
spec.replicas
필드의 값을 확인합니다.apiVersion: cluster.x-k8s.io/v1beta1 kind: MachineSet metadata: name: <machine_set_name> namespace: openshift-cluster-api spec: replicas: 2 1 # ...
- 1
- 이 절차의 예제에서는
replicas
값이2
인 컴퓨팅 머신 세트를 보여줍니다.
- 원하는 구성 옵션을 사용하여 컴퓨팅 머신 세트 CR을 업데이트하고 변경 사항을 저장합니다.
다음 명령을 실행하여 업데이트된 컴퓨팅 머신 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.cluster.x-k8s.io \ -n openshift-cluster-api \ -l cluster.x-k8s.io/set-name=<machine_set_name>
AWS 클러스터의 출력 예
NAME CLUSTER NODENAME PROVIDERID PHASE AGE VERSION <machine_name_original_1> <cluster_name> <original_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 4h <machine_name_original_2> <cluster_name> <original_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 4h
업데이트된 컴퓨팅 머신 세트에서 관리하는 각 머신에 대해 다음 명령을 실행하여
삭제
주석을 설정합니다.$ oc annotate machines.cluster.x-k8s.io/<machine_name_original_1> \ -n openshift-cluster-api \ cluster.x-k8s.io/delete-machine="true"
다음 명령을 실행하여 컴퓨팅 머신 세트를 복제본 수의 두 배로 스케일링합니다.
$ oc scale --replicas=4 \1 machinesets.cluster.x-k8s.io <machine_set_name> \ -n openshift-cluster-api
- 1
- 원래 예제 값
2
는4
로 두 배가됩니다.
다음 명령을 실행하여 업데이트된 컴퓨팅 머신 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.cluster.x-k8s.io \ -n openshift-cluster-api \ -l cluster.x-k8s.io/set-name=<machine_set_name>
AWS 클러스터의 출력 예
NAME CLUSTER NODENAME PROVIDERID PHASE AGE VERSION <machine_name_original_1> <cluster_name> <original_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 4h <machine_name_original_2> <cluster_name> <original_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 4h <machine_name_updated_1> <cluster_name> <updated_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Provisioned 55s <machine_name_updated_2> <cluster_name> <updated_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Provisioning 55s
새 머신이
Running
단계에 있는 경우 컴퓨팅 머신 세트를 원래 복제본 수로 확장할 수 있습니다.다음 명령을 실행하여 컴퓨팅 머신 세트를 원래 복제본 수로 확장합니다.
$ oc scale --replicas=2 \1 machinesets.cluster.x-k8s.io <machine_set_name> \ -n openshift-cluster-api
- 1
- 원래 예제 값인
2
입니다.
검증
업데이트된 머신 세트로 생성된 머신에 올바른 구성이 있는지 확인하려면 다음 명령을 실행하여 새 머신 중 하나에 대해 CR의 관련 필드를 검사합니다.
$ oc describe machines.cluster.x-k8s.io <machine_name_updated_1> \ -n openshift-cluster-api
업데이트된 구성이 없는 컴퓨팅 머신이 삭제되었는지 확인하려면 다음 명령을 실행하여 업데이트된 컴퓨팅 시스템 세트에서 관리하는 머신을 나열합니다.
$ oc get machines.cluster.x-k8s.io \ -n openshift-cluster-api \ cluster.x-k8s.io/set-name=<machine_set_name>
AWS 클러스터의 삭제가 진행되는 동안 출력 예
NAME CLUSTER NODENAME PROVIDERID PHASE AGE VERSION <machine_name_original_1> <cluster_name> <original_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m <machine_name_original_2> <cluster_name> <original_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m <machine_name_updated_1> <cluster_name> <updated_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m <machine_name_updated_2> <cluster_name> <updated_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m
AWS 클러스터의 삭제가 완료된 때의 출력 예
NAME CLUSTER NODENAME PROVIDERID PHASE AGE VERSION <machine_name_updated_1> <cluster_name> <updated_1_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m <machine_name_updated_2> <cluster_name> <updated_2_ip>.<region>.compute.internal aws:///us-east-2a/i-04e7b2cbd61fd2075 Running 18m
13.4. 클러스터 API 구성
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
다음 예제 YAML 파일은 Cluster API 기본 리소스가 함께 작동하도록 만들고 사용자 환경에 적합한 시스템에 대한 설정을 구성하는 방법을 보여줍니다.
13.4.1. 클러스터 API 클러스터 리소스의 샘플 YAML
클러스터 리소스는 클러스터의 이름 및 인프라 공급자를 정의하고 클러스터 API에서 관리합니다. 이 리소스는 모든 공급업체에 대해 동일한 구조를 갖습니다.
apiVersion: cluster.x-k8s.io/v1beta1 kind: Cluster metadata: name: <cluster_name> 1 namespace: openshift-cluster-api spec: infrastructureRef: apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: <infrastructure_kind> 2 name: <cluster_name> namespace: openshift-cluster-api
13.4.2. 공급자별 구성 옵션
나머지 클러스터 API 리소스는 공급자에 따라 다릅니다. 클러스터의 공급자별 구성 옵션은 다음 리소스를 참조하십시오.
13.5. 클러스터 API 시스템에 대한 구성 옵션
13.5.1. Amazon Web Services의 클러스터 API 구성 옵션
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
Cluster API 사용자 정의 리소스 매니페스트에서 값을 업데이트하여 AWS(Amazon Web Services) 클러스터 API 머신의 구성을 변경할 수 있습니다.
13.5.1.1. Amazon Web Services 클러스터 구성을 위한 샘플 YAML
다음 예제 YAML 파일은 Amazon Web Services 클러스터에 대한 구성을 보여줍니다.
13.5.1.1.1. Amazon Web Services에서 클러스터 API 인프라 리소스의 샘플 YAML
인프라 리소스는 공급자마다 다르며 리전 및 서브넷과 같이 클러스터의 모든 컴퓨팅 머신 세트에서 공유하는 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 이 리소스를 참조합니다.
apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: AWSCluster 1 metadata: name: <cluster_name> 2 namespace: openshift-cluster-api spec: controlPlaneEndpoint: 3 host: <control_plane_endpoint_address> port: 6443 region: <region> 4
13.5.1.1.2. Amazon Web Services에서 Cluster API 머신 템플릿 리소스의 샘플 YAML
머신 템플릿 리소스는 공급자별로 다르며 컴퓨팅 머신 세트가 생성하는 시스템의 기본 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 이 템플릿을 참조합니다.
apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: AWSMachineTemplate 1 metadata: name: <template_name> 2 namespace: openshift-cluster-api spec: template: spec: 3 uncompressedUserData: true iamInstanceProfile: # ... instanceType: m5.large cloudInit: insecureSkipSecretsManager: true ami: id: # ... subnet: filters: - name: tag:Name values: - # ... additionalSecurityGroups: - filters: - name: tag:Name values: - # ...
13.5.1.1.3. Amazon Web Services에서 Cluster API 컴퓨팅 머신 세트 리소스의 샘플 YAML
컴퓨팅 머신 세트 리소스는 생성하는 시스템의 추가 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 인프라 리소스 및 머신 템플릿도 참조합니다.
apiVersion: cluster.x-k8s.io/v1beta1 kind: MachineSet metadata: name: <machine_set_name> 1 namespace: openshift-cluster-api spec: clusterName: <cluster_name> 2 replicas: 1 selector: matchLabels: test: example template: metadata: labels: test: example spec: bootstrap: dataSecretName: worker-user-data 3 clusterName: <cluster_name> infrastructureRef: apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: AWSMachineTemplate 4 name: <template_name> 5
13.5.2. Google Cloud Platform의 클러스터 API 구성 옵션
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
Cluster API 사용자 정의 리소스 매니페스트에서 값을 업데이트하여 GCP(Google Cloud Platform) 클러스터 API 머신의 구성을 변경할 수 있습니다.
13.5.2.1. Google Cloud Platform 클러스터 구성을 위한 샘플 YAML
다음 예제 YAML 파일은 Google Cloud Platform 클러스터에 대한 구성을 보여줍니다.
13.5.2.1.1. Google Cloud Platform에서 클러스터 API 인프라 리소스의 샘플 YAML
인프라 리소스는 공급자마다 다르며 리전 및 서브넷과 같이 클러스터의 모든 컴퓨팅 머신 세트에서 공유하는 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 이 리소스를 참조합니다.
apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: GCPCluster 1 metadata: name: <cluster_name> 2 spec: controlPlaneEndpoint: 3 host: <control_plane_endpoint_address> port: 6443 network: name: <cluster_name>-network project: <project> 4 region: <region> 5
13.5.2.1.2. Google Cloud Platform에서 클러스터 API 머신 템플릿 리소스의 샘플 YAML
머신 템플릿 리소스는 공급자별로 다르며 컴퓨팅 머신 세트가 생성하는 시스템의 기본 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 이 템플릿을 참조합니다.
apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: GCPMachineTemplate 1 metadata: name: <template_name> 2 namespace: openshift-cluster-api spec: template: spec: 3 rootDeviceType: pd-ssd rootDeviceSize: 128 instanceType: n1-standard-4 image: projects/rhcos-cloud/global/images/rhcos-411-85-202203181601-0-gcp-x86-64 subnet: <cluster_name>-worker-subnet serviceAccounts: email: <service_account_email_address> scopes: - https://www.googleapis.com/auth/cloud-platform additionalLabels: kubernetes-io-cluster-<cluster_name>: owned additionalNetworkTags: - <cluster_name>-worker ipForwarding: Disabled
13.5.2.1.3. Google Cloud Platform에서 클러스터 API 컴퓨팅 머신 세트 리소스의 샘플 YAML
컴퓨팅 머신 세트 리소스는 생성하는 시스템의 추가 속성을 정의합니다. 컴퓨팅 머신 세트는 머신을 생성할 때 인프라 리소스 및 머신 템플릿도 참조합니다.
apiVersion: cluster.x-k8s.io/v1beta1 kind: MachineSet metadata: name: <machine_set_name> 1 namespace: openshift-cluster-api spec: clusterName: <cluster_name> 2 replicas: 1 selector: matchLabels: test: example template: metadata: labels: test: example spec: bootstrap: dataSecretName: worker-user-data 3 clusterName: <cluster_name> infrastructureRef: apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: GCPMachineTemplate 4 name: <template_name> 5 failureDomain: <failure_domain> 6
13.6. Cluster API를 사용하는 클러스터 문제 해결
클러스터 API로 머신 관리는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원되지 않으며 기능적으로 완전하지 않을 수 있습니다. 따라서 프로덕션 환경에서 사용하는 것은 권장하지 않습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능의 지원 범위에 대한 자세한 내용은 기술 프리뷰 기능 지원 범위를 참조하십시오.
이 섹션의 정보를 사용하여 발생할 수 있는 문제를 이해하고 복구합니다. 일반적으로 클러스터 API 관련 문제에 대한 문제 해결 단계는 Machine API 관련 문제에 대한 단계와 유사합니다.
Cluster CAPI Operator 및 해당 피연산자는 openshift-cluster-api
네임스페이스에 프로비저닝된 반면 Machine API에서는 openshift-machine-api
네임스페이스를 사용합니다. 네임스페이스를 참조하는 oc
명령을 사용하는 경우 올바른 명령을 참조해야 합니다.
13.6.1. CLI를 사용할 때 의도된 오브젝트 참조
Cluster API를 사용하는 클러스터의 경우 OpenShift CLI(oc
) 명령은 Machine API 오브젝트를 통해 Cluster API 오브젝트를 우선시합니다.
이 동작은 Cluster API 및 Machine API 둘 다에 표시되는 모든 오브젝트에 대해 작동하는 oc
명령에 영향을 미칩니다. 이 설명에서는 oc delete machine
명령을 사용하여 시스템을 삭제합니다. 예를 들면 다음과 같습니다.
원인
oc
명령을 실행할 때 oc
는 Kube API 서버와 통신하여 작업할 오브젝트를 결정합니다. Kube API 서버는 oc
명령이 실행될 때 알파벳순으로 표시되는 첫 번째 설치된 CRD(사용자 정의 리소스 정의)를 사용합니다.
Cluster API 오브젝트의 CRD는 cluster.x-k8s.io
그룹에 있으며 Machine API 오브젝트의 CRD는 machine.openshift.io
그룹에 있습니다. 문자 c
는 알파벳순으로 문자 앞에 있기 때문에 Kube API 서버는 Cluster API 오브젝트 CRD에서 일치합니다. 결과적으로
oc
명령은 Cluster API 오브젝트에서 작동합니다.
결과
이 동작으로 인해 Cluster API를 사용하는 클러스터에서 다음과 같은 의도하지 않은 결과가 발생할 수 있습니다.
-
두 유형의 오브젝트가 모두 포함된 네임스페이스의 경우
oc get machine
과 같은 명령은 Cluster API 오브젝트만 반환합니다. -
Machine API 오브젝트만 포함하는 네임스페이스의 경우
oc get machine
과 같은 명령은 결과를 반환하지 않습니다.
해결방법
oc
명령이 정규화된 해당 이름을 사용하여 원하는 오브젝트 유형에서 작동하는지 확인할 수 있습니다.
사전 요구 사항
-
cluster-admin
권한이 있는 계정을 사용하여 클러스터에 액세스할 수 있습니다. -
OpenShift CLI(
oc
)가 설치되어 있습니다.
절차
Machine API 머신을 삭제하려면
oc delete machine
명령을 실행할 때 정규화된 이름machine.machine.openshift.io
를 사용합니다.$ oc delete machine.machine.openshift.io <machine_name>
클러스터 API 머신을 삭제하려면
oc delete machine
명령을 실행할 때 정규화된 이름machine.cluster.x-k8s.io
를 사용합니다.$ oc delete machine.cluster.x-k8s.io <machine_name>
14장. 머신 상태 확인
머신 풀에서 손상된 머신을 자동으로 복구하도록 머신 상태 점검을 구성하고 배포할 수 있습니다.
머신 API가 작동하는 클러스터에서만 고급 머신 관리 및 스케일링 기능을 사용할 수 있습니다. 사용자 프로비저닝 인프라가 있는 클러스터에는 Machine API를 사용하려면 추가 검증 및 구성이 필요합니다.
인프라 플랫폼 유형의 클러스터가 Machine API를 사용할 수 없습니다
. 이 제한은 클러스터에 연결된 컴퓨팅 시스템이 기능을 지원하는 플랫폼에 설치된 경우에도 적용됩니다. 이 매개변수는 설치 후 변경할 수 없습니다.
클러스터의 플랫폼 유형을 보려면 다음 명령을 실행합니다.
$ oc get infrastructure cluster -o jsonpath='{.status.platform}'
14.1. 머신 상태 점검 정보
컴퓨팅 머신 세트 또는 컨트롤 플레인 머신 세트에서 관리하는 머신에만 머신 상태 점검을 적용할 수 있습니다.
머신 상태를 모니터링하기 위해 컨트롤러 구성을 정의할 리소스를 만듭니다. NotReady
상태를 5 분 동안 유지하거나 노드 문제 탐지기(node-problem-detector)에 영구적인 조건을 표시하는 등 검사할 조건과 모니터링할 머신 세트의 레이블을 설정합니다.
MachineHealthCheck
리소스를 관찰하는 컨트롤러에서 정의된 상태를 확인합니다. 머신이 상태 확인에 실패하면 머신이 자동으로 삭제되고 대체할 머신이 만들어집니다. 머신이 삭제되면 machine deleted
이벤트가 표시됩니다.
머신 삭제로 인한 영향을 제한하기 위해 컨트롤러는 한 번에 하나의 노드 만 드레인하고 삭제합니다. 대상 머신 풀에서 허용된 maxUnhealthy
임계값 보다 많은 비정상적인 머신이 있는 경우 수동 개입이 수행될 수 있도록 복구가 중지됩니다.
워크로드 및 요구 사항을 살펴보고 신중하게 시간 초과를 고려하십시오.
- 시간 제한이 길어지면 비정상 머신의 워크로드에 대한 다운타임이 길어질 수 있습니다.
-
시간 초과가 너무 짧으면 수정 루프가 발생할 수 있습니다. 예를 들어
NotReady
상태를 확인하는 시간은 머신이 시작 프로세스를 완료할 수 있을 만큼 충분히 길어야 합니다.
검사를 중지하려면 리소스를 제거합니다.
14.1.1. 머신 상태 검사 배포 시 제한 사항
머신 상태 점검을 배포하기 전에 고려해야 할 제한 사항은 다음과 같습니다.
- 머신 세트가 소유한 머신만 머신 상태 검사를 통해 업데이트를 적용합니다.
- 머신의 노드가 클러스터에서 제거되면 머신 상태 점검에서 이 머신을 비정상적으로 간주하고 즉시 업데이트를 적용합니다.
-
nodeStartupTimeout
후 시스템의 해당 노드가 클러스터에 참여하지 않으면 업데이트가 적용됩니다. -
Machine
리소스 단계가Failed
하면 즉시 머신에 업데이트를 적용합니다.
14.2. MachineHealthCheck 리소스 샘플
베어 메탈 이외의 모든 클라우드 기반 설치 유형에 대한 MachineHealthCheck
리소스는 다음 YAML 파일과 유사합니다.
apiVersion: machine.openshift.io/v1beta1 kind: MachineHealthCheck metadata: name: example 1 namespace: openshift-machine-api spec: selector: matchLabels: machine.openshift.io/cluster-api-machine-role: <role> 2 machine.openshift.io/cluster-api-machine-type: <role> 3 machine.openshift.io/cluster-api-machineset: <cluster_name>-<label>-<zone> 4 unhealthyConditions: - type: "Ready" timeout: "300s" 5 status: "False" - type: "Ready" timeout: "300s" 6 status: "Unknown" maxUnhealthy: "40%" 7 nodeStartupTimeout: "10m" 8
- 1
- 배포할 머신 상태 점검의 이름을 지정합니다.
- 2 3
- 확인할 머신 풀의 레이블을 지정합니다.
- 4
- 추적할 머신 세트를
<cluster_name>-<label>-<zone>
형식으로 지정합니다. 예를 들어prod-node-us-east-1a
입니다. - 5 6
- 노드 상태에 대한 시간 제한을 지정합니다. 시간 제한 기간 중 상태가 일치되면 머신이 수정됩니다. 시간 제한이 길어지면 비정상 머신의 워크로드에 대한 다운타임이 길어질 수 있습니다.
- 7
- 대상 풀에서 동시에 복구할 수 있는 시스템 수를 지정합니다. 이는 백분율 또는 정수로 설정할 수 있습니다. 비정상 머신의 수가
maxUnhealthy
에서의 설정 제한을 초과하면 복구가 수행되지 않습니다. - 8
- 머신 상태가 비정상으로 확인되기 전에 노드가 클러스터에 참여할 때까지 기다려야 하는 시간 초과 기간을 지정합니다.
matchLabels
는 예제일 뿐입니다. 특정 요구에 따라 머신 그룹을 매핑해야 합니다.
14.2.1. 쇼트 서킷 (Short Circuit) 머신 상태 점검 및 수정
쇼트 서킷(Short-circuiting)은 클러스터가 정상일 때만 머신 상태 점검을 통해 머신을 조정합니다. 쇼트 서킷은 MachineHealthCheck
리소스의 maxUnhealthy
필드를 통해 구성됩니다.
사용자가 시스템을 조정하기 전에 maxUnhealthy
필드 값을 정의하는 경우 MachineHealthCheck
는 비정상적으로 결정된 대상 풀 내의 maxUnhealthy
값과 비교합니다. 비정상 머신의 수가 maxUnhealthy
제한을 초과하면 수정을 위한 업데이트가 수행되지 않습니다.
maxUnhealthy
가 설정되지 않은 경우 기본값은 100%
로 설정되고 클러스터 상태와 관계없이 머신이 수정됩니다.
적절한 maxUnhealthy
값은 배포하는 클러스터의 규모와 MachineHealthCheck에서
다루는 시스템 수에 따라 달라집니다. 예를 들어 maxUnhealthy
값을 사용하여 여러 가용성 영역에서 여러 컴퓨팅 머신 세트를 처리할 수 있으므로 전체 영역을 손실하면 maxUnhealthy
설정이 클러스터 내에서 추가 수정을 방지할 수 있습니다. 여러 가용성 영역이 없는 글로벌 Azure 리전에서는 가용성 세트를 사용하여 고가용성을 보장할 수 있습니다.
컨트롤 플레인에 대해 MachineHealthCheck
리소스를 구성하는 경우 maxUnhealthy
값을 1
로 설정합니다.
이 구성을 사용하면 여러 컨트롤 플레인 머신이 비정상으로 표시되면 머신 상태 점검이 수행되지 않습니다. 비정상적인 여러 컨트롤 플레인 시스템은 etcd 클러스터의 성능이 저하되었거나 실패한 머신을 교체하는 확장 작업이 진행 중임을 나타낼 수 있습니다.
etcd 클러스터가 성능이 저하되면 수동 개입이 필요할 수 있습니다. 스케일링 작업이 진행 중인 경우 머신 상태 점검을 통해 완료할 수 있어야 합니다.
maxUnhealthy
필드는 정수 또는 백분율로 설정할 수 있습니다. maxUnhealthy
값에 따라 다양한 수정을 적용할 수 있습니다.
14.2.1.1. 절대 값을 사용하여 maxUnhealthy 설정
maxUnhealthy
가 2
로 설정된 경우
- 2개 이상의 노드가 비정상인 경우 수정을 위한 업데이트가 수행됩니다.
- 3개 이상의 노드가 비정상이면 수정을 위한 업데이트가 수행되지 않습니다
이러한 값은 머신 상태 점검에서 확인할 수 있는 머신 수와 관련이 없습니다.
14.2.1.2. 백분율을 사용하여 maxUnhealthy 설정
maxUnhealthy
가 40%
로 설정되어 있고 25 대의 시스템이 확인되고 있는 경우 다음을 수행하십시오.
- 10개 이상의 노드가 비정상인 경우 수정을 위한 업데이트가 수행됩니다.
- 11개 이상의 노드가 비정상인 경우 수정을 위한 업데이트가 수행되지 않습니다.
maxUnhealthy
가 40%
로 설정되어 있고 6 대의 시스템이 확인되고 있는 경우 다음을 수행하십시오.
- 2개 이상의 노드가 비정상인 경우 수정을 위한 업데이트가 수행됩니다.
- 3개 이상의 노드가 비정상이면 수정을 위한 업데이트가 수행되지 않습니다
maxUnhealthy
머신의 백분율이 정수가 아닌 경우 허용되는 머신 수가 반올림됩니다.
14.3. 머신 상태 점검 리소스 생성
클러스터의 머신 세트에 대한 MachineHealthCheck
리소스를 생성할 수 있습니다.
컴퓨팅 머신 세트 또는 컨트롤 플레인 머신 세트에서 관리하는 머신에만 머신 상태 점검을 적용할 수 있습니다.
사전 요구 사항
-
oc
명령행 인터페이스를 설치합니다.
절차
-
머신 상태 점검 정의가 포함된
healthcheck.yml
파일을 생성합니다. healthcheck.yml
파일을 클러스터에 적용합니다.$ oc apply -f healthcheck.yml
머신 상태 점검을 구성하고 배포하여 비정상적인 베어 메탈 노드를 감지하고 복구할 수 있습니다.
14.4. 베어 메탈의 전원 기반 업데이트 적용 정보
베어 메탈 클러스터에서 노드의 업데이트 적용은 클러스터의 전반적인 상태를 보장하는 데 중요합니다. 물리적으로 클러스터에 업데이트를 적용하는 것은 어려움이 있을 수 있으며 머신을 안전하거나 운영 체제로 전환하기 위한 지연으로 인해 클러스터가 성능 저하된 상태로 유지되는 시간이 길어지고 이후의 장애 발생으로 인해 클러스터가 클러스터를 오프라인 상태가 될 수 있습니다. 전원 기반 문제 해결은 이러한 문제에 대응하는 데 도움이 됩니다.
전원 기반 업데이트 적용에서는 노드를 재프로비저닝하는 대신 전원 컨트롤러를 사용하여 작동하지 않는 노드의 전원을 끕니다. 이러한 유형의 수정을 전원 펜싱이라고 합니다.
OpenShift Container Platform은 MachineHealthCheck
컨트롤러를 사용하여 문제가 있는 베어 메탈 노드를 감지합니다. 전원 기반 업데이트 적용은 신속하게 수행되며 클러스터에서 문제가 있는 노드를 제거하는 대신 재부팅합니다.
전원 기반 업데이트 적용은 다음과 같은 기능을 제공합니다.
- 컨트롤 플레인 노드를 복구 가능
- 하이퍼 컨버지드 환경에서 데이터 손실 위험 감소
- 물리적 머신 복구와 관련된 다운타임 감소
14.4.1. 베어 메탈에서 MachineHealthCheck
베어 메탈 클러스터에서 머신 삭제를 사용하면 베어 메탈 호스트의 재프로비저닝이 트리거됩니다. 일반적으로 베어 메탈 재프로비저닝은 시간이 오래 걸리는 프로세스로, 이 과정에서 클러스터에 컴퓨팅 리소스가 누락되고 애플리케이션이 중단될 수 있습니다.
기본 수정 프로세스를 머신 삭제에서 호스트 전원 사이클로 변경하는 방법은 다음 두 가지가 있습니다.
-
machine.openshift.io/remediation-strategy: external-baremetal
주석을 사용하여MachineHealthCheck
리소스에 주석을 답니다. -
Metal3RemediationTemplate
리소스를 생성하고MachineHealthCheck
의spec.remediationTemplate
에서 참조하십시오.
이러한 방법 중 하나를 사용한 후 BMC(Baseboard Management Controller) 인증 정보를 사용하여 비정상 머신의 전원 사이클이 켜집니다.
14.4.2. 주석 기반 수정 프로세스 이해
수정 프로세스는 다음과 같이 작동합니다.
- MHC(MachineHealthCheck) 컨트롤러는 노드가 비정상임을 감지합니다.
- MHC는 비정상 노드의 전원을 끄도록 요청하는 베어 메탈 머신 컨트롤러에 통지합니다.
- 전원이 꺼지면 노드가 삭제되어 클러스터가 다른 노드에서 영향을 받는 워크로드를 다시 예약할 수 있습니다.
- 베어 메탈 머신 컨트롤러에서 노드의 전원을 켜도록 요청합니다.
- 노드가 가동되면 노드가 클러스터와 함께 다시 등록되어 새 노드가 생성됩니다.
- 노드가 다시 생성되면 베어 메탈 머신 컨트롤러는 삭제하기 전에 비정상 노드에 존재하는 주석 및 레이블을 복원합니다.
전원 작업이 완료되지 않은 경우 베어 메탈 머신 컨트롤러는 컨트롤 플레인 노드 또는 외부 프로비저닝 노드가 아닌 한 비정상 노드의 재프로비저닝을 트리거합니다.
14.4.3. metal3- 기반 수정 프로세스 이해
수정 프로세스는 다음과 같이 작동합니다.
- MHC(MachineHealthCheck) 컨트롤러는 노드가 비정상임을 감지합니다.
- MHC는 비정상 노드의 전원을 끄도록 요청하는 metal3 수정 컨트롤러의 metal3 수정 사용자 정의 리소스를 생성합니다.
- 전원이 꺼지면 노드가 삭제되어 클러스터가 다른 노드에서 영향을 받는 워크로드를 다시 예약할 수 있습니다.
- metal3 수정 컨트롤러에서 노드의 전원을 켜도록 요청합니다.
- 노드가 가동되면 노드가 클러스터와 함께 다시 등록되어 새 노드가 생성됩니다.
- 노드가 다시 생성되면 metal3 수정 컨트롤러는 삭제하기 전에 비정상 노드에 존재하는 주석 및 라벨을 복원합니다.
전원 작업이 완료되지 않으면 metal3 수정 컨트롤러에서 컨트롤 플레인 노드 또는 외부 프로비저닝 노드가 아닌 한 비정상 노드의 재프로비저닝을 트리거합니다.
14.4.4. 베어 메탈의 MachineHealthCheck 리소스 생성
사전 요구 사항
- OpenShift Container Platform은 설치 관리자 프로비저닝 인프라(IPI)를 사용하여 설치됩니다.
- BMC 자격 증명(또는 각 노드에 대한 BMC 액세스)에 액세스합니다.
- 비정상 노드의 BMC 인터페이스에 대한 네트워크 액세스가 있어야 합니다.
절차
-
머신 상태 점검 정의가 포함된
healthcheck.yaml
파일을 생성합니다. 다음 명령을 사용하여
healthcheck.yaml
파일을 클러스터에 적용합니다.$ oc apply -f healthcheck.yaml
베어 메탈, 주석 기반 수정을 위한 MachineHealthCheck
리소스 샘플
apiVersion: machine.openshift.io/v1beta1 kind: MachineHealthCheck metadata: name: example 1 namespace: openshift-machine-api annotations: machine.openshift.io/remediation-strategy: external-baremetal 2 spec: selector: matchLabels: machine.openshift.io/cluster-api-machine-role: <role> 3 machine.openshift.io/cluster-api-machine-type: <role> 4 machine.openshift.io/cluster-api-machineset: <cluster_name>-<label>-<zone> 5 unhealthyConditions: - type: "Ready" timeout: "300s" 6 status: "False" - type: "Ready" timeout: "300s" 7 status: "Unknown" maxUnhealthy: "40%" 8 nodeStartupTimeout: "10m" 9
- 1
- 배포할 머신 상태 점검의 이름을 지정합니다.
- 2
- 베어 메탈 클러스터의 경우 전원 사이클 수정을 활성화하려면
annotations
섹션에machine.openshift.io/remediation-strategy: external-baremetal
주석을 포함해야 합니다. 이 업데이트 적용 전략으로 비정상 호스트가 클러스터에서 제거되지 않고 재부팅됩니다. - 3 4
- 확인할 머신 풀의 레이블을 지정합니다.
- 5
- 추적할 컴퓨팅 머신 세트를 <
cluster_name>-<label>-<zone
> 형식으로 지정합니다. 예를 들어prod-node-us-east-1a
입니다. - 6 7
- 노드 상태에 대한 시간 제한을 지정합니다. 시간 제한 기간 중 상태가 일치되면 머신이 수정됩니다. 시간 제한이 길어지면 비정상 머신의 워크로드에 대한 다운타임이 길어질 수 있습니다.
- 8
- 대상 풀에서 동시에 복구할 수 있는 시스템 수를 지정합니다. 이는 백분율 또는 정수로 설정할 수 있습니다. 비정상 머신의 수가
maxUnhealthy
에서의 설정 제한을 초과하면 복구가 수행되지 않습니다. - 9
- 머신 상태가 비정상으로 확인되기 전에 노드가 클러스터에 참여할 때까지 기다려야 하는 시간 초과 기간을 지정합니다.
matchLabels
는 예제일 뿐입니다. 특정 요구에 따라 머신 그룹을 매핑해야 합니다.
베어 메탈, metal3 기반 수정을 위한 MachineHealthCheck
리소스 샘플
apiVersion: machine.openshift.io/v1beta1 kind: MachineHealthCheck metadata: name: example namespace: openshift-machine-api spec: selector: matchLabels: machine.openshift.io/cluster-api-machine-role: <role> machine.openshift.io/cluster-api-machine-type: <role> machine.openshift.io/cluster-api-machineset: <cluster_name>-<label>-<zone> remediationTemplate: apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: Metal3RemediationTemplate name: metal3-remediation-template namespace: openshift-machine-api unhealthyConditions: - type: "Ready" timeout: "300s"
베어 메탈, metal3- 기반 수정을 위한 샘플 Metal3RemediationTemplate
리소스
apiVersion: infrastructure.cluster.x-k8s.io/v1beta1 kind: Metal3RemediationTemplate metadata: name: metal3-remediation-template namespace: openshift-machine-api spec: template: spec: strategy: type: Reboot retryLimit: 1 timeout: 5m0s
matchLabels
는 예제일 뿐입니다. 특정 요구에 따라 머신 그룹을 매핑해야 합니다. annotations
섹션은 metal3- 기반 수정에는 적용되지 않습니다. 주석 기반 수정 및 metal3- 기반 수정은 함께 사용할 수 없습니다.
14.4.5. 전원 기반 수정 문제 해결
전원 기반 수정 문제를 해결하려면 다음을 확인합니다.
- BMC에 액세스할 수 있습니다.
- BMC는 수정 작업을 실행하는 컨트롤 플레인 노드에 연결됩니다.
Legal Notice
Copyright © 2024 Red Hat, Inc.
OpenShift documentation is licensed under the Apache License 2.0 (https://www.apache.org/licenses/LICENSE-2.0).
Modified versions must remove all Red Hat trademarks.
Portions adapted from https://github.com/kubernetes-incubator/service-catalog/ with modifications by Red Hat.
Red Hat, Red Hat Enterprise Linux, the Red Hat logo, the Shadowman logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.
Linux® is the registered trademark of Linus Torvalds in the United States and other countries.
Java® is a registered trademark of Oracle and/or its affiliates.
XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.
MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.
Node.js® is an official trademark of Joyent. Red Hat Software Collections is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.
The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation’s permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.
All other trademarks are the property of their respective owners.