4.9. Descheduler
4.9.1. Descheduler 개요
스케줄러 는 새 Pod를 호스팅하는 데 가장 적합한 노드를 결정하는 데 사용되지만 Descheduler는 더 적합한 노드에 Pod를 다시 예약할 수 있도록 실행 중인 Pod를 제거하는 데 사용할 수 있습니다.
4.9.1.1. Descheduler 정보
Descheduler를 사용하면 특정 전략에 따라 Pod를 제거하여 Pod를 더 적절한 노드에 다시 예약할 수 있습니다.
다음과 같은 상황에서 실행 중인 Pod의 일정을 조정하면 이점을 누릴 수 있습니다.
- 노드가 충분히 사용되지 않았거나 너무 많이 사용되었습니다.
- 오염 또는 라벨과 같은 Pod 및 노드 선호도 요구 사항이 변경되었으며, 원래 일정 결정이 더 이상 특정 노드에 적합하지 않습니다.
- 노드 장애로 Pod를 이동해야 합니다.
- 새 노드가 클러스터에 추가되었습니다.
- Pod가 너무 많이 재시작되었습니다.
Descheduler는 제거된 Pod의 교체를 예약하지 않습니다. 제거된 Pod에 대한 이러한 작업은 스케줄러에서 자동으로 수행합니다.
Descheduler가 노드에서 Pod를 제거하도록 결정하는 경우 다음과 같은 일반 메커니즘을 사용합니다.
-
openshift-*
및kube-system
네임스페이스의 Pod는 제거되지 않습니다. -
priorityClassName
이system-cluster-critical
또는system-node-critical
로 설정된 중요 Pod는 제거되지 않습니다. - 복제 컨트롤러, 복제본 세트, 배포 또는 작업에 포함되지 않는 정적, 미러링 또는 독립형 Pod는 다시 생성되지 않기 때문에 제거되지 않습니다.
- 데몬 세트와 연결된 Pod는 제거되지 않습니다.
- 로컬 스토리지가 있는 Pod는 제거되지 않습니다.
- 최상의 Pod가 버스트 가능 Pod 및 보장된 Pod보다 먼저 제거됩니다.
-
descheduler.alpha.kubernetes.io/evict
주석이 있는 모든 Pod 유형을 제거할 수 있습니다. 이 주석은 제거를 방지하는 검사를 덮어쓰는 데 사용되며 사용자는 제거할 Pod를 선택할 수 있습니다. 사용자는 Pod를 다시 생성하는 방법과 다시 생성되는지의 여부를 알아야 합니다. - PDB(Pod 중단 예산)가 적용되는 Pod는 일정 조정에서 해당 PDB를 위반하는 경우 제거되지 않습니다. Pod는 PDB를 처리하는 제거 하위 리소스를 사용하여 제거합니다.
4.9.1.2. Descheduler 프로필
다음 Descheduler 프로필을 사용할 수 있습니다.
AffinityAndTaints
이 프로필은 Pod 간 유사성 방지, 노드 유사성, 노드 테인트를 위반하는 Pod를 제거합니다.
다음과 같은 전략을 활성화합니다.
-
RemovePodsViolatingInterPodAntiAffinity
: Pod 간 유사성 방지를 위반하는 Pod를 제거합니다. -
RemovePodsViolatingNodeAffinity
: 노드 유사성을 위반하는 Pod를 제거합니다. RemovePodsViolatingNodeTaints
: 노드에서NoSchedule
테인트를 위반하는 Pod를 제거합니다.노드 유사성 유형이
requiredDuringSchedulingIgnoredDuringExecution
인 Pod가 제거됩니다.
-
TopologyAndDuplicates
이 프로필은 노드 간에 유사한 Pod 또는 동일한 토폴로지 도메인의 Pod를 균등하게 분배하기 위해 Pod를 제거합니다.
다음과 같은 전략을 활성화합니다.
-
RemovePodsViolatingTopologySpreadConstraint
:DoNotSchedule
제약 조건을 위반하는 경우 균형이 맞지 않는 토폴로지 도메인을 찾아 더 큰 도메인에서 Pod를 제거합니다. -
RemoveDuplicates
: 동일한 노드에서 실행 중인 복제본 세트, 복제 컨트롤러, 배포 또는 작업과 연결된 Pod가 하나뿐인지 확인합니다. Pod가 두 개 이상인 경우 클러스터에서 Pod를 더 잘 배포하기 위해 이러한 중복 Pod를 제거합니다.
-
LifecycleAndUtilization
이 프로필은 장기 실행 Pod를 제거하고 노드 간 리소스 사용량의 균형을 조정합니다.
다음과 같은 전략을 활성화합니다.
RemovePodsHavingTooManyRestarts
: 컨테이너가 너무 여러 번 재시작된 Pod를 제거합니다.Init Container를 포함하여 모든 컨테이너(Init Container 포함)를 다시 시작할 수 있는 Pod 수가 100을 초과합니다.
LowNodeUtilization
: 활용도가 낮은 노드를 찾고, Pod 재생성 시 Pod가 이처럼 활용도가 낮은 노드에 예약되도록 가능하면 과도하게 사용된 노드에서 Pod를 제거합니다.모든 임계값(CPU, 메모리, Pod 수)에서 사용량이 20% 미만인 경우 노드는 활용도가 낮은 것으로 간주됩니다.
모든 임계값(CPU, 메모리, Pod 수)에서 사용량이 50%를 초과하면 노드는 과도하게 사용되는 것으로 간주됩니다.
PodLifeTime
: 너무 오래된 Pod를 제거합니다.기본적으로 24시간이 지난 Pod가 제거됩니다. Pod 수명 값을 사용자 지정할 수 있습니다.
SoftTopologyAndDuplicates
이 프로필은
whenUnsatisfiable: ScheduleAnyway
와 같은 소프트 토폴로지 제약 조건이 있는 Pod도 제거용으로 간주된다는 점을 제외하고TopologyAndDuplicates
와 동일합니다.참고softTopologyAndDuplicates 및
를 모두 활성화하지 마십시오. 두 결과를 모두 활성화하면 충돌이 발생합니다.TopologyAndDuplicates
EvictPodsWithLocalStorage
- 이 프로필을 사용하면 로컬 스토리지가 있는 Pod를 제거할 수 있습니다.
EvictPodsWithPVC
-
이 프로필을 사용하면 영구 볼륨 클레임이 있는 Pod를 제거할 수 있습니다.
Kubernetes NFS 하위 디렉터리 외부 프로비저닝기를
사용하는 경우 프로비저너가 설치된 네임스페이스에 대해 제외된 네임스페이스를 추가해야 합니다.
4.9.2. kube Descheduler Operator 릴리스 노트
Kube Descheduler Operator를 사용하면 Pod를 제거하여 더 적절한 노드에서 다시 예약할 수 있습니다.
이 릴리스 노트에서는 Kube Descheduler Operator의 개발을 추적합니다.
자세한 내용은 Descheduler 정보를 참조하십시오.
4.9.2.1. Kube Descheduler Operator 5.0.1 릴리스 노트
출시 날짜: 2024년 7월 1일
Kube Descheduler Operator 5.0.1에 대해 다음 권고를 사용할 수 있습니다.
4.9.2.1.1. 새로운 기능 및 개선 사항
이제 FIPS 모드에서 실행되는 OpenShift Container Platform 클러스터에서 Kube Descheduler Operator를 설치하고 사용할 수 있습니다.
중요클러스터의 FIPS 모드를 활성화하려면 FIPS 모드에서 작동하도록 구성된 RHEL(Red Hat Enterprise Linux) 컴퓨터에서 설치 프로그램을 실행해야 합니다. RHEL에서 FIPS 모드 구성에 대한 자세한 내용은 FIPS 모드에서 시스템 설치를 참조하십시오.
FIPS 모드에서 부팅된 RHEL(Red Hat Enterprise Linux CoreOS) 또는 RHCOS(Red Hat Enterprise Linux CoreOS)를 실행하는 경우 OpenShift Container Platform 코어 구성 요소는 x86_64, ppc64le 및 s390x 아키텍처에서만 FIPS 140-2/140-3 Validation에 대해 NIST에 제출된 RHEL 암호화 라이브러리를 사용합니다.
4.9.2.1.2. 버그 수정
- 이번 Kube Descheduler Operator 릴리스는 여러 CVE(Common Vulnerabilities and Exposures)를 처리합니다.
4.9.2.2. Kube Descheduler Operator 5.0.0 릴리스 정보
출시 날짜: 2024년 3월 6일
Kube Descheduler Operator 5.0.0에 대해 다음 권고를 사용할 수 있습니다.
4.9.2.2.1. 주요 변경 사항
- 이번 릴리스에서는 Kube Descheduler Operator가 OpenShift Container Platform 마이너 버전 릴리스 스트림과 관계없이 업데이트를 제공합니다.
4.9.2.2.2. 버그 수정
-
이전에는 Descheduler Pod 로그에 Operator 버전에 대한 다음 경고가 표시되었습니다.
Descheduler 마이너 버전을 float로 변환하지 못했습니다
. 이번 업데이트를 통해 더 이상 경고가 표시되지 않습니다. (OCPBUGS-14042)
4.9.3. Descheduler를 사용하여 Pod 제거
Kube Descheduler Operator를 설치하고 원하는 프로필 및 기타 사용자 정의를 설정하여 OpenShift Container Platform에서 Descheduler를 실행할 수 있습니다.
4.9.3.1. Descheduler 설치
Descheduler는 기본적으로 사용할 수 없습니다. Descheduler를 활성화하려면 OperatorHub에서 Kube Descheduler Operator를 설치하고 Descheduler 프로필을 한 개 이상 활성화해야 합니다.
기본적으로 Descheduler는 예측 모드에서 실행되므로 Pod 제거만 시뮬레이션합니다. Pod 제거를 수행하려면 Descheduler가 자동으로 모드를 변경해야 합니다.
클러스터에서 호스팅되는 컨트롤 플레인을 활성화한 경우 사용자 정의 우선순위 임계값을 설정하여 호스팅된 컨트롤 플레인 네임스페이스의 Pod가 제거될 가능성을 줄입니다. 호스팅된 컨트롤 플레인 우선순위 클래스 클래스의 가장 낮은 우선 순위 값(100000000
)이 있으므로 우선순위 임계값 클래스 이름을 hypershift-control-plane
로 설정합니다.
사전 요구 사항
-
cluster-admin
역할의 사용자로 OpenShift Container Platform에 로그인되어 있습니다. - OpenShift Container Platform 웹 콘솔에 액세스합니다.
프로세스
- OpenShift Container Platform 웹 콘솔에 로그인합니다.
Kube Descheduler Operator에 필요한 네임스페이스를 생성합니다.
-
관리
네임스페이스로 이동하여 네임스페이스 생성을 클릭합니다. -
이름 필드에
openshift-kube-descheduler-operator
를 입력하고 라벨 필드에openshift.io/cluster-monitoring=true
를 입력하여 Descheduler 지표를 활성화한 후 생성 을 클릭합니다.
-
관리
Kube Descheduler Operator를 설치합니다.
-
Operators
OperatorHub로 이동합니다. - 필터 박스에 Kube Descheduler Operator를 입력합니다.
- Kube Descheduler Operator를 선택하고 설치를 클릭합니다.
- Operator 설치 페이지에서 클러스터의 특정 네임스페이스를 선택합니다. 드롭다운 메뉴에서 openshift-kube-descheduler-operator를 선택합니다.
- 업데이트 채널 및 승인 전략 값을 원하는 값으로 조정합니다.
- 설치를 클릭합니다.
-
Operators
Descheduler 인스턴스를 생성합니다.
-
Operator
설치된 Operator 페이지에서 Kube Descheduler Operator를 클릭합니다. - Kube Descheduler 탭을 선택하고 KubeDescheduler 생성을 클릭합니다.
필요에 따라 설정을 편집합니다.
- 제거 시뮬레이션 대신 Pod를 제거하려면 Mode 필드를 자동으로 변경합니다.
-
Operator
4.9.3.2. Descheduler 프로필 구성
Descheduler에서 Pod를 제거하는 데 사용하는 프로필을 구성할 수 있습니다.
사전 요구 사항
-
cluster-admin
역할의 사용자로 OpenShift Container Platform에 로그인되어 있습니다.
프로세스
KubeDescheduler
오브젝트를 편집합니다.$ oc edit kubedeschedulers.operator.openshift.io cluster -n openshift-kube-descheduler-operator
spec.profiles
섹션에 하나 이상의 프로필을 지정합니다.apiVersion: operator.openshift.io/v1 kind: KubeDescheduler metadata: name: cluster namespace: openshift-kube-descheduler-operator spec: deschedulingIntervalSeconds: 3600 logLevel: Normal managementState: Managed operatorLogLevel: Normal mode: Predictive 1 profileCustomizations: namespaces: 2 excluded: - my-namespace podLifetime: 48h 3 thresholdPriorityClassName: my-priority-class-name 4 profiles: 5 - AffinityAndTaints - TopologyAndDuplicates 6 - LifecycleAndUtilization - EvictPodsWithLocalStorage - EvictPodsWithPVC
- 1
- 선택 사항: 기본적으로 Descheduler는 Pod를 제거하지 않습니다. Pod를 제거하려면
mode
를Automatic
으로 설정합니다. - 2
- 선택 사항: Descheduler 작업을 포함하거나 제외하도록 사용자가 생성한 네임스페이스 목록을 설정합니다. 제외하거나 포함할 네임스페이스 목록을 설정하려면
excluded
을 사용하여 네임스페이스 목록을 설정합니다.보호된 네임스페이스(
openshift-*
,kube-system
,hypershift
)는 기본적으로 제외됩니다. - 3
- 선택 사항:
LifecycleAndUtilization
프로필에 사용자 정의 Pod 수명 값을 활성화합니다. 유효한 단위는s
,m
또는h
입니다. 기본 Pod 수명은 24시간입니다. - 4
- 선택 사항: 우선순위가 지정된 수준보다 낮은 경우에만 Pod가 제거되도록 우선순위 임계값을 지정합니다.
thresholdPriority
필드를 사용하여 숫자 우선순위 임계값(예:10000
)을 설정하거나thresholdPriorityClassName
필드를 사용하여 특정 우선순위 클래스 이름(예:my-priority-class-name
)을 지정합니다. 우선순위 클래스 이름을 지정하는 경우 이미 있어야 합니다. 그러지 않으면 Descheduler에서 오류가 발생합니다.thresholdPriority
및thresholdPriorityClassName
을 둘 다 설정하지 마십시오. - 5
- 활성화할 프로필을 하나 이상 추가합니다. 사용 가능한 프로필:
AffinityAndTaints
,TopologyAndDuplicates
,LifecycleAndUtilization
,softTopologyAndDuplicates
,EvictPodsWithLocalStorage
,EvictPodsWithPVC
. - 6
TopologyAndDuplicates
및softTopologyAndDuplicates
를 모두 활성화하지 마십시오. 두 결과를 모두 활성화하면 충돌이 발생합니다.
여러 프로필을 활성화할 수 있으며 프로필을 지정하는 순서는 중요하지 않습니다.
- 파일을 저장하여 변경 사항을 적용합니다.
4.9.3.3. Descheduler 간격 구성
Descheduler 실행 간격을 구성할 수 있습니다. 기본값은 3600초(1시간)입니다.
사전 요구 사항
-
cluster-admin
역할의 사용자로 OpenShift Container Platform에 로그인되어 있습니다.
프로세스
KubeDescheduler
오브젝트를 편집합니다.$ oc edit kubedeschedulers.operator.openshift.io cluster -n openshift-kube-descheduler-operator
deschedulingIntervalSeconds
필드를 원하는 값으로 업데이트합니다.apiVersion: operator.openshift.io/v1 kind: KubeDescheduler metadata: name: cluster namespace: openshift-kube-descheduler-operator spec: deschedulingIntervalSeconds: 3600 1 ...
- 1
- Descheduler 실행 간격을 초 단위로 설정합니다. 이 필드 값이
0
이면 Descheduler가 한 번 실행되고 종료됩니다.
- 파일을 저장하여 변경 사항을 적용합니다.
4.9.4. Kube Descheduler Operator 설치 제거
Operator를 설치 제거하고 관련 리소스를 제거하여 OpenShift Container Platform에서 Kube Descheduler Operator를 제거할 수 있습니다.
4.9.4.1. Descheduler 설치 제거
Descheduler 인스턴스를 제거하고 Kube Descheduler Operator를 설치 제거하여 클러스터에서 Descheduler를 제거할 수 있습니다. 이 프로세스는 KubeDescheduler
CRD 및 openshift-kube-descheduler-operator
네임스페이스도 정리합니다.
사전 요구 사항
-
cluster-admin
역할의 사용자로 OpenShift Container Platform에 로그인되어 있습니다. - OpenShift Container Platform 웹 콘솔에 액세스합니다.
프로세스
- OpenShift Container Platform 웹 콘솔에 로그인합니다.
Descheduler 인스턴스를 삭제합니다.
-
Operator
설치된 Operator 페이지에서 Kube Descheduler Operator를 클릭합니다. - Kube Descheduler 탭을 선택합니다.
- 클러스터 항목 옆에 있는 옵션 메뉴 를 클릭하고 KubeDescheduler 삭제 를 선택합니다.
- 확인 대화 상자에서 삭제를 클릭합니다.
-
Operator
Kube Descheduler Operator를 설치 제거합니다.
-
Operators
설치된 Operator로 이동합니다. - Kube Descheduler Operator 항목 옆에 있는 옵션 메뉴 를 클릭하고 Operator 설치 제거를 선택합니다.
- 확인 대화 상자에서 설치 제거를 클릭합니다.
-
Operators
openshift-kube-descheduler-operator
네임스페이스를 삭제합니다.-
관리
네임스페이스로 이동합니다. -
필터 박스에
openshift-kube-descheduler-operator
를 입력합니다. - openshift-kube-descheduler-operator 항목 옆에 있는 옵션 메뉴 를 클릭하고 네임스페이스 삭제 를 선택합니다.
-
확인 대화 상자에서
openshift-kube-descheduler-operator
를 입력하고 삭제를 클릭합니다.
-
관리
KubeDescheduler
CRD를 삭제합니다.-
Administration
Custom Resource Definitions로 이동합니다. -
필터 박스에
KubeDescheduler
를 입력합니다. - KubeDescheduler 항목 옆에 있는 옵션 메뉴 를 클릭하고 CustomResourceDefinition 삭제 를 선택합니다.
- 확인 대화 상자에서 삭제를 클릭합니다.
-
Administration