1.4. 문제 해결
클러스터 관리자는 다음 OpenShift Container Platform 구성 요소 문제를 모니터링하고 해결할 수 있습니다.
설치 문제: OpenShift Container Platform 설치가 다양한 단계에 걸쳐 진행됩니다. 다음을 수행할 수 있습니다.
- 설치 단계를 모니터링합니다.
- 설치 문제가 발생하는 단계 확인.
- 여러 설치 문제를 조사합니다.
- 실패한 설치에서 로그를 수집합니다.
노드 문제: 클러스터 관리자는 노드의 상태, 리소스 사용량 및 구성을 검토하여 노드 관련 문제를 확인하고 해결할 수 있습니다. 다음을 쿼리할 수 있습니다.
- 노드의 kubelet 상태입니다.
- 클러스터 노드 저널 로그.
crio 문제: 클러스터 관리자는 각 클러스터 노드에서 CRI-O 컨테이너 런타임 엔진 상태를 확인할 수 있습니다. 컨테이너 런타임 문제가 발생하면 다음을 수행합니다.
- CRI-O journald 장치 로그를 수집합니다.
- CRI-O 스토리지 정리.
운영 체제 문제: OpenShift Container Platform은 Red Hat Enterprise Linux CoreOS에서 실행됩니다. 운영 체제 문제가 발생하면 커널 크래시 프로시저를 조사할 수 있습니다. 다음을 확인합니다.
- kdump 활성화.
- kdump 구성을 테스트합니다.
- 코어 덤프 분석.
네트워크 문제: Open vSwitch 문제를 해결하려면 클러스터 관리자가 다음을 수행할 수 있습니다.
- Open vSwitch 로그 수준을 일시적으로 구성합니다.
- Open vSwitch 로그 수준을 영구적으로 구성합니다.
- Open vSwitch 로그를 표시합니다.
Operator 문제: 클러스터 관리자는 다음을 수행하여 Operator 문제를 해결할 수 있습니다.
- Operator 서브스크립션 상태를 확인합니다.
- Operator Pod 상태를 확인합니다.
- Operator 로그를 수집합니다.
Pod 문제: 클러스터 관리자는 Pod 상태를 검토하고 다음을 수행하여 Pod 관련 문제를 해결할 수 있습니다.
- 포드 및 컨테이너 로그를 검토합니다.
- 루트 액세스 권한으로 디버그 Pod를 시작합니다.
S2I 문제: 클러스터 관리자는 S2I 단계를 관찰하여 S2I 프로세스에서 오류가 발생한 위치를 확인할 수 있습니다. 다음을 수집하여 S2I(Source-to-Image) 문제를 해결합니다.
- S2I(Source-to-Image) 진단 데이터.
- 애플리케이션 오류를 조사하기 위한 애플리케이션 진단 데이터.
스토리지 문제: 실패한 노드에서 연결된 볼륨을 마운트 해제할 수 없기 때문에 새 노드에 볼륨을 마운트할 수 없는 경우 다중 연결 스토리지 오류가 발생합니다. 클러스터 관리자는 다음을 수행하여 다중 연결 스토리지 문제를 해결할 수 있습니다.
- RWX 볼륨을 사용하여 여러 연결을 활성화합니다.
- RWO 볼륨을 사용할 때 오류가 발생한 노드를 복구하거나 삭제합니다.
모니터링 문제: 클러스터 관리자는 문제 해결 페이지의 절차에 따라 모니터링할 수 있습니다. 사용자 정의 프로젝트의 메트릭을 사용할 수 없거나 Prometheus가 많은 디스크 공간을 사용하는 경우 다음을 확인하십시오.
- 사용자 정의 지표를 사용할 수 없는 이유를 조사합니다.
- Prometheus가 많은 디스크 공간을 사용하는 이유를 확인합니다.
로깅 문제: 클러스터 관리자는 OpenShift 로깅 문제에 대한 문제 해결 페이지에서 절차를 실행할 수 있습니다. 다음을 확인하여 로깅 문제를 해결합니다.
- OpenShift CLI (oc) 문제: 로그 수준을 늘려 OpenShift CLI (oc) 문제를 조사합니다.