1.4. 문제 해결
클러스터 관리자는 다음 OpenShift Container Platform 구성 요소 문제를 모니터링하고 해결할 수 있습니다.
설치 문제: OpenShift Container Platform 설치는 다양한 단계로 진행됩니다. 다음을 수행할 수 있습니다.
- 설치 단계를 모니터링합니다.
- 어떤 단계에서 설치 문제가 발생하는지 확인합니다.
- 여러 설치 문제를 조사합니다.
- 실패한 설치에서 로그를 수집합니다.
노드 문제: 클러스터 관리자는 노드의 상태, 리소스 사용량 및 구성을 검토하여 노드 관련 문제를 확인하고 해결할 수 있습니다. 다음을 쿼리할 수 있습니다.
- 노드의 kubelet 상태입니다.
- 클러스터 노드 저널 로그입니다.
crio 문제: 클러스터 관리자는 각 클러스터 노드에서 CRI-O 컨테이너 런타임 엔진 상태를 확인할 수 있습니다. 컨테이너 런타임 문제가 발생하는 경우 다음을 수행합니다.
- CRI-O journald 장치 로그를 수집합니다.
- CRI-O 스토리지 정리.
운영 체제 문제: OpenShift Container Platform은 Red Hat Enterprise Linux CoreOS에서 실행됩니다. 운영 체제 문제가 발생하는 경우 커널 충돌 절차를 조사할 수 있습니다. 다음을 확인하십시오.
- kdump를 활성화합니다.
- kdump 설정을 테스트합니다.
- 코어 덤프를 분석합니다.
네트워크 문제: Open vSwitch 문제를 해결하기 위해 클러스터 관리자는 다음을 수행할 수 있습니다.
- Open vSwitch 로그 수준을 일시적으로 구성합니다.
- Open vSwitch 로그 수준을 영구적으로 구성합니다.
- Open vSwitch 로그를 표시합니다.
Operator 문제: 클러스터 관리자는 다음을 수행하여 Operator 문제를 해결할 수 있습니다.
- Operator 서브스크립션 상태를 확인합니다.
- Operator Pod 상태를 확인합니다.
- Operator 로그를 수집합니다.
Pod 문제: 클러스터 관리자는 Pod 상태를 검토하고 다음을 완료하여 Pod 관련 문제를 해결할 수 있습니다.
- Pod 및 컨테이너 로그를 검토합니다.
- root 액세스 권한으로 디버그 Pod를 시작합니다.
S2I 프로세스에서 오류가 발생한 위치를 확인하기 위해 클러스터 관리자는 S2I 단계를 관찰할 수 있습니다. 다음을 수집하여 S2I(Source-to-Image) 문제를 해결합니다.
- S2I(Source-to-Image) 진단 데이터입니다.
- 애플리케이션 오류를 조사하기 위한 애플리케이션 진단 데이터입니다.
스토리지 문제: 실패한 노드가 연결된 볼륨을 마운트 해제할 수 없기 때문에 새 노드의 마운트 볼륨이 불가능한 경우 다중 연결 스토리지 오류가 발생합니다. 클러스터 관리자는 다음을 수행하여 다중 연결 스토리지 문제를 해결할 수 있습니다.
- RWX 볼륨을 사용하여 여러 연결을 활성화합니다.
- RWO 볼륨을 사용할 때 오류가 발생한 노드를 복구하거나 삭제합니다.
모니터링 문제: 클러스터 관리자는 모니터링을 위해 문제 해결 페이지의 절차를 따를 수 있습니다. 사용자 정의 프로젝트의 지표를 사용할 수 없거나 Prometheus가 많은 디스크 공간을 사용하는 경우 다음을 확인하십시오.
- 사용자 정의 메트릭을 사용할 수 없는 이유를 조사합니다.
- Prometheus가 많은 디스크 공간을 소비하는 이유를 확인합니다.
-
OpenShift CLI(
oc
) 문제: 로그 수준을 늘려 OpenShift CLI(oc
) 문제 조사