13장. 노드 유지보수
13.1. 노드 유지보수 정보
13.1.1. 노드 유지보수 모드 정보
노드는 oc adm
유틸리티 또는 NodeMaintenance
사용자 정의 리소스 (CR)를 사용하여 유지보수 모드로 전환할 수 있습니다.
node-maintenance-operator
(NMO)는 더 이상 OpenShift Virtualization과 함께 제공되지 않습니다. 이제 OpenShift Container Platform 웹 콘솔의 OperatorHub 에서 독립형 Operator로 배포하거나 OpenShift CLI(oc
)를 사용하여 배포할 수 있습니다.
노드를 유지보수 모드에 배치하면 노드가 스케줄링할 수 없는 것으로 표시되고 모든 가상 머신과 Pod가 드레인됩니다. LiveMigrate
제거 전략이 있는 가상 머신 인스턴스는 서비스 손실 없이 다른 노드로 실시간 마이그레이션됩니다. 이 제거 전략은 공통 템플릿으로 생성한 가상 머신에는 기본적으로 구성되지만 사용자 정의 가상 머신은 수동으로 구성해야 합니다.
제거 전략이 없는 가상 머신 인스턴스가 종료됩니다. Running
또는 RerunOnFailure
의 RunStrategy
가 있는 가상 머신은 다른 노드에서 다시 생성됩니다. Manual
의 RunStrategy
가 있는 가상 머신은 자동으로 다시 시작되지 않습니다.
가상 머신에 실시간 마이그레이션할 공유 ReadWriteMany
(RWX) 액세스 모드의 PVC(영구 볼륨 클레임)가 있어야 합니다.
Node Maintenance Operator는 신규 또는 삭제된 NodeMaintenance
CR을 감시합니다. 새 NodeMaintenance
CR이 감지되면 새 워크로드가 예약되지 않고 나머지 클러스터에서 노드가 차단됩니다. 제거할 수 있는 모든 Pod는 노드에서 제거됩니다. NodeMaintenance
CR이 삭제되면 CR에서 참조되는 노드를 새 워크로드에 사용할 수 있습니다.
노드 유지관리 작업에 NodeMaintenance
CR을 사용하면 표준 OpenShift Container Platform 사용자 정의 리소스 처리를 사용하여 oc adm cordon
및 oc adm drain
명령과 동일한 결과를 얻을 수 있습니다.
13.1.2. 베어 메탈 노드 유지관리
베어 메탈 인프라에 OpenShift Container Platform을 배포할 때 클라우드 인프라에 배포하는 것과 비교하여 고려해야 할 추가 고려 사항이 있습니다. 클러스터 노드가 사용 후 삭제로 간주되는 클라우드 환경에서와 달리 베어 메탈 노드를 다시 프로비저닝하려면 유지관리 작업에 더 많은 시간과 노력이 필요합니다.
예를 들어 치명적인 커널 오류가 발생하거나 NIC 카드 하드웨어 장애가 발생하는 것과 같이 베에메탈 노드에 장애가 발생한 경우 문제가 발생한 노드가 복구 되거나 교체되는 동안 장애가 발생한 노드의 워크로드를 클러스터의 다른 곳에서 다시 시작해야 합니다. 클러스터 관리자는 노드 유지관리 모드를 통해 노드의 전원을 정상적으로 끄고 워크로드를 클러스터의 다른 부분으로 이동하여 워크로드가 중단되지 않도록 할 수 있습니다. 유지보수 관리 중에 자세한 진행 상황 및 노드 상태 세부 정보가 제공됩니다.