이 섹션에는 Red Hat Advanced Cluster Management 또는 다중 클러스터 엔진 Operator와 함께 Submariner를 사용할 때 발생할 수 있는 하위 문제 해결 절차가 나열되어 있습니다. 일반적인 Submariner 문제 해결 정보는 Submariner 문서의 문제 해결을 참조하십시오.

Submariner 네트워킹 서비스 및 서비스 검색에 대한 기본 문서를 보려면 Submariner 다중 클러스터 네트워킹 및 서비스 검색을 참조하십시오.

설치 후 Submariner가 연결되지 않음 문제 해결 - 일반 정보
Submariner 애드온 상태 문제 해결
Submariner 엔드 투 엔드 테스트 실패 문제 해결

1.2. must-gather 명령을 실행하여 문제 해결
링크 복사

문제 해결을 시작하려면 사용자가 must-gather 명령을 실행하여 문제를 디버깅하는 데 필요한 문제 해결 시나리오에 대해 확인한 다음 명령 사용을 시작하는 절차를 참조하십시오.

필수 액세스: 클러스터 관리자

1.2.1. must-gather 시나리오
링크 복사

시나리오 1: 문서화된 문제 해결 섹션을 사용하여 문제에 대한 해결 방법이 문서화되어 있는지 확인합니다. 이 가이드는 제품의 주요 기능에 의해 구성됩니다.
이 시나리오에서는 가이드가 설명서에 있는지 확인합니다. 예를 들어 클러스터 생성에 문제가 있는 경우 클러스터 관리 섹션에서 솔루션을 찾을 수 있습니다.
시나리오 2: 해결 단계에 문제가 문서화되지 않은 경우 must-gather 명령을 실행하고 출력을 사용하여 문제를 디버깅합니다.
시나리오 3: must-gather 명령의 출력을 사용하여 문제를 디버깅할 수 없는 경우 Red Hat 지원과 출력을 공유하십시오.

1.2.2. must-gather 절차
링크 복사

must-gather 명령을 사용하려면 다음 절차를 참조하십시오.

must-gather 명령에 대해 알아보고 Red Hat OpenShift Container Platform 설명서에서 클러스터에 대한 데이터 가져오기에서 필요한 사전 요구 사항을 설치합니다.
클러스터에 로그인합니다. 데이터 및 디렉터리 수집에 사용되는 Red Hat Advanced Cluster Management for Kubernetes 이미지를 추가합니다. 다음 명령을 실행하여 출력 이미지와 디렉터리를 삽입합니다.
```
oc adm must-gather --image=registry.redhat.io/rhacm2/acm-must-gather-rhel9:v2.12 --dest-dir=<directory>
```
일반적인 사용 사례의 경우 hub 클러스터에 로그인하는 동안 must-gather 를 실행해야 합니다.
참고: 관리 클러스터를 확인하려면 cluster-scoped-resources 디렉터리에 있는 gather-managed.log 파일을 찾습니다.
```
<your-directory>/cluster-scoped-resources/gather-managed.log>
```
JOINED 및 AVAILABLE 열에 True 가 설정되지 않은 관리형 클러스터를 확인합니다. True 상태와 연결되지 않은 클러스터에서 must-gather 명령을 실행할 수 있습니다.
지정된 디렉터리로 이동하여 다음 수준에서 구성된 출력을 확인합니다.
- 두 개의 피어 수준: cluster-scoped-resources 및 namespace resources.
- 각 하위 수준: 클러스터 범위 및 네임스페이스 범위 리소스 모두에 대한 사용자 정의 리소스 정의에 대한 API 그룹입니다.
- 유형별로 정렬된 YAML 파일 각의 다음 수준 .

1.2.3. 연결이 끊긴 환경의 must-gather
링크 복사

연결이 끊긴 환경에서 must-gather 명령을 실행하려면 다음 단계를 완료합니다.

연결이 끊긴 환경에서 Red Hat Operator 카탈로그 이미지를 미러 레지스트리에 미러링합니다. 자세한 내용은 연결이 끊긴 네트워크 환경에서 설치를 참조하십시오.
다음 명령을 실행하여 모든 정보를 수집하여 < 2.x >를 < acm-must-gather> (예: 2.10 ) 및 < multicluster- engine/must-gather > (예: 2.5 ) 모두에 대해 지원되는 버전으로 바꿉니다.
```
REGISTRY=<internal.repo.address:port>
IMAGE1=$REGISTRY/rhacm2/acm-must-gather-rhel9:v<2.x>
oc adm must-gather --image=$IMAGE1 --dest-dir=<directory>
```

현재 지원되는 릴리스 중 하나 또는 제품 문서에 문제가 발생하는 경우 Red Hat 지원팀으로 이동하여 추가 문제를 해결하거나 기술 자료 문서를 보거나 지원 팀과 연결하거나 케이스를 열 수 있습니다. Red Hat 인증 정보를 사용하여 로그인해야 합니다.

1.2.4. 호스트 클러스터의 must-gather
링크 복사

호스팅된 컨트롤 플레인 클러스터에 문제가 발생하는 경우 must-gather 명령을 실행하여 문제 해결에 도움이 되는 정보를 수집할 수 있습니다.

1.2.4.1. 호스팅된 클러스터의 must-gather 명령 정보
링크 복사

명령은 관리 클러스터 및 호스팅된 클러스터에 대한 출력을 생성합니다.

다중 클러스터 엔진 Operator 허브 클러스터의 데이터:
- 클러스터 범위 리소스: 이러한 리소스는 관리 클러스터의 노드 정의입니다.
- hypershift-dump 압축 파일: 이 파일은 다른 사용자와 콘텐츠를 공유해야 하는 경우에 유용합니다.
- 네임스페이스 리소스: 이러한 리소스에는 구성 맵, 서비스, 이벤트 및 로그와 같은 관련 네임스페이스의 모든 오브젝트가 포함됩니다.
- 네트워크 로그: 이 로그에는 OVN northbound 및 southbound 데이터베이스와 각각에 대한 상태가 포함됩니다.
- 호스트 클러스터: 이 수준의 출력에는 호스팅된 클러스터 내부의 모든 리소스가 포함됩니다.
호스트 클러스터의 데이터:
- 클러스터 범위 리소스: 이러한 리소스에는 노드 및 CRD와 같은 모든 클러스터 전체 오브젝트가 포함됩니다.
- 네임스페이스 리소스: 이러한 리소스에는 구성 맵, 서비스, 이벤트 및 로그와 같은 관련 네임스페이스의 모든 오브젝트가 포함됩니다.

출력에 클러스터의 보안 오브젝트가 포함되어 있지 않지만 시크릿 이름에 대한 참조를 포함할 수 있습니다.

1.2.4.2. 사전 요구 사항
링크 복사

must-gather 명령을 실행하여 정보를 수집하려면 다음 사전 요구 사항을 충족해야 합니다.

kubeconfig 파일이 로드되고 다중 클러스터 엔진 Operator 허브 클러스터를 가리키는지 확인해야 합니다.
다중 클러스터 엔진 Operator 허브 클러스터에 대한 cluster-admin 액세스 권한이 있어야 합니다.
HostedCluster 리소스의 name 값과 사용자 정의 리소스가 배포된 네임스페이스가 있어야 합니다.

1.2.4.3. 호스트된 클러스터에 대한 must-gather 명령 입력
링크 복사

호스트된 클러스터에 대한 정보를 수집하려면 다음 명령을 입력합니다. 명령에서 hosted-cluster-namespace=HOSTEDCLUSTERNAMESPACE 매개변수는 선택 사항입니다. 포함하지 않으면 호스트 클러스터가 기본 네임스페이스인 것처럼 명령이 실행됩니다.
```
oc adm must-gather --image=quay.io/stolostron/backplane-must-gather:SNAPSHOTNAME /usr/bin/gather hosted-cluster-namespace=HOSTEDCLUSTERNAMESPACE hosted-cluster-name=HOSTEDCLUSTERNAME
```

명령 결과를 압축 파일에 저장하려면 NAME 을 결과를 저장하려는 디렉터리 이름으로 교체하여 --dest-dir=NAME 매개변수를 포함합니다.

oc adm must-gather --image=quay.io/stolostron/backplane-must-gather:SNAPSHOTNAME /usr/bin/gather hosted-cluster-namespace=HOSTEDCLUSTERNAMESPACE hosted-cluster-name=HOSTEDCLUSTERNAME --dest-dir=NAME ; tar -cvzf NAME.tgz NAME

1.2.4.4. 연결이 끊긴 환경에서 must-gather 명령 입력
링크 복사

연결이 끊긴 환경에서 must-gather 명령을 실행하려면 다음 단계를 완료합니다.

연결이 끊긴 환경에서 Red Hat Operator 카탈로그 이미지를 미러 레지스트리에 미러링합니다. 자세한 내용은 연결이 끊긴 네트워크 환경에서 설치를 참조하십시오.

다음 명령을 실행하여 미러 레지스트리에서 이미지를 참조하는 로그를 추출합니다.

REGISTRY=registry.example.com:5000
IMAGE=$REGISTRY/multicluster-engine/must-gather-rhel8@sha256:ff9f37eb400dc1f7d07a9b6f2da9064992934b69847d17f59e385783c071b9d8

oc adm must-gather --image=$IMAGE /usr/bin/gather hosted-cluster-namespace=HOSTEDCLUSTERNAMESPACE hosted-cluster-name=HOSTEDCLUSTERNAME --dest-dir=./data

1.2.4.5. 추가 리소스
링크 복사

호스트된 컨트롤 플레인 문제 해결에 대한 자세한 내용은 OpenShift Container Platform 설명서의 호스트된 컨트롤 플레인 문제 해결을 참조하십시오.

1.3. 설치 또는 보류 중인 설치 상태 문제 해결
링크 복사

Red Hat Advanced Cluster Management를 설치할 때 MultiClusterHub 는 설치 단계에 남아 있거나 여러 Pod가 Pending 상태를 유지합니다.

1.3.1. 증상: 보류 중 상태 발생
링크 복사

MultiClusterHub를 설치한 후 10 분 이상 전달되었으며 MultiClusterHub 리소스의 status.components 필드에서 하나 이상의 구성 요소가 ProgressDeadlineExceeded. 클러스터의 리소스 제약 조건이 문제가 될 수 있습니다.

Multiclusterhub 가 설치된 네임스페이스에서 Pod를 확인합니다. 다음과 유사한 상태로 보류 중이 표시될 수 있습니다.

reason: Unschedulable
message: '0/6 nodes are available: 3 Insufficient cpu, 3 node(s) had taint {node-role.kubernetes.io/master:
        }, that the pod didn't tolerate.'

이 경우 제품을 실행하기 위해 작업자 노드 리소스가 클러스터에 충분하지 않습니다.

1.3.2. 문제 해결: 작업자 노드 크기 조정
링크 복사

이 문제가 있는 경우 더 큰 작업자 노드로 클러스터를 업데이트해야 합니다. 클러스터 크기 지정에 대한 지침은 클러스터 크기 조정을 참조하십시오.

1.4. Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

2.7.x에서 2.8.x로 업그레이드한 후 multicluster-engine 네임스페이스의 ocm-controller 가 충돌합니다.

1.4.1. 증상: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

ManagedClusterSet 및 ManagedClusterSetBinding 사용자 정의 리소스 정의를 나열하려는 후 다음 오류 메시지가 표시됩니다.

Error from server: request to convert CR from an invalid group/version: cluster.open-cluster-management.io/v1beta1

이전 메시지는 ManagedClusterSets 및 ManagedClusterSetBindings 사용자 정의 리소스 정의 v1beta1 에서 v1beta2 로의 사용자 정의 리소스 정의가 실패했음을 나타냅니다.

1.4.2. 문제 해결: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

이 오류를 해결하려면 API 마이그레이션을 수동으로 시작해야 합니다. 다음 단계를 완료합니다.

cluster-manager 를 이전 릴리스로 되돌립니다.

다음 명령을 사용하여 다중 클러스터 엔진 을 일시 중지합니다.
```
oc annotate mce multiclusterengine pause=true
```

다음 명령을 실행하여 cluster-manager 배포의 이미지를 이전 버전으로 교체합니다.

oc patch deployment cluster-manager -n multicluster-engine -p \  '{"spec":{"template":{"spec":{"containers":[{"name":"registration-operator","image":"registry.redhat.io/multicluster-engine/registration-operator-rhel8@sha256:35999c3a1022d908b6fe30aa9b85878e666392dbbd685e9f3edcb83e3336d19f"}]}}}}'
export ORIGIN_REGISTRATION_IMAGE=$(oc get clustermanager cluster-manager -o jsonpath='{.spec.registrationImagePullSpec}')

ClusterManager 리소스의 등록 이미지 참조를 이전 버전으로 교체합니다. 다음 명령을 실행합니다.

oc patch clustermanager cluster-manager --type='json' -p='[{"op": "replace", "path": "/spec/registrationImagePullSpec", "value": "registry.redhat.io/multicluster-engine/registration-rhel8@sha256:a3c22aa4326859d75986bf24322068f0aff2103cccc06e1001faaf79b9390515"}]'

다음 명령을 실행하여 ManagedClusterSets 및 ManagedClusterSetBindings 사용자 정의 리소스 정의를 이전 릴리스로 되돌립니다.

oc annotate crds managedclustersets.cluster.open-cluster-management.io operator.open-cluster-management.io/version-
oc annotate crds  managedclustersetbindings.cluster.open-cluster-management.io operator.open-cluster-management.io/version-

cluster-manager 를 다시 시작하고 사용자 정의 리소스 정의가 다시 생성될 때까지 기다립니다. 다음 명령을 실행합니다.

oc -n multicluster-engine delete pods -l app=cluster-manager
oc wait crds managedclustersets.cluster.open-cluster-management.io --for=jsonpath="{.metadata.annotations['operator\.open-cluster-management\.io/version']}"="2.3.3" --timeout=120s
oc wait crds managedclustersetbindings.cluster.open-cluster-management.io --for=jsonpath="{.metadata.annotations['operator\.open-cluster-management\.io/version']}"="2.3.3" --timeout=120s

다음 명령을 사용하여 스토리지 버전 마이그레이션을 시작합니다.

oc patch StorageVersionMigration managedclustersets.cluster.open-cluster-management.io --type='json' -p='[{"op":"replace", "path":"/spec/resource/version", "value":"v1beta1"}]'
oc patch StorageVersionMigration managedclustersets.cluster.open-cluster-management.io --type='json' --subresource status -p='[{"op":"remove", "path":"/status/conditions"}]'
oc patch StorageVersionMigration managedclustersetbindings.cluster.open-cluster-management.io --type='json' -p='[{"op":"replace", "path":"/spec/resource/version", "value":"v1beta1"}]'
oc patch StorageVersionMigration managedclustersetbindings.cluster.open-cluster-management.io --type='json' --subresource status -p='[{"op":"remove", "path":"/status/conditions"}]'

다음 명령을 실행하여 마이그레이션이 완료될 때까지 기다립니다.

oc wait storageversionmigration managedclustersets.cluster.open-cluster-management.io --for=condition=Succeeded --timeout=120s
oc wait storageversionmigration managedclustersetbindings.cluster.open-cluster-management.io --for=condition=Succeeded --timeout=120s

cluster-manager 를 Red Hat Advanced Cluster Management 2.12로 복원합니다. 몇 분 정도 걸릴 수 있습니다. 다음 명령을 실행합니다.

oc annotate mce multiclusterengine pause-
oc patch clustermanager cluster-manager --type='json' -p='[{"op": "replace", "path": "/spec/registrationImagePullSpec", "value": "'$ORIGIN_REGISTRATION_IMAGE'"}]'

1.4.2.1. 검증
링크 복사

Red Hat Advanced Cluster Management가 복구되었는지 확인하려면 다음 명령을 실행합니다.

oc get managedclusterset
oc get managedclustersetbinding -A

명령을 실행하면 ManagedClusterSets 및 ManagedClusterSetBindings 리소스가 오류 메시지 없이 나열됩니다.

1.5. 오프라인 클러스터 문제 해결
링크 복사

오프라인 상태를 표시하는 클러스터에는 몇 가지 일반적인 원인이 있습니다.

1.5.1. 증상: 클러스터 상태가 오프라인 상태
링크 복사

클러스터 생성 절차를 완료한 후에는 Red Hat Advanced Cluster Management 콘솔에서 액세스할 수 없으며 오프라인 상태가 표시됩니다.

1.5.2. 문제 해결: 클러스터 상태가 오프라인 상태입니다.
링크 복사

관리 클러스터를 사용할 수 있는지 확인합니다. Red Hat Advanced Cluster Management 콘솔의 Clusters 영역에서 확인할 수 있습니다.
사용할 수 없는 경우 관리 클러스터를 다시 시작하십시오.
관리 클러스터 상태가 여전히 오프라인 상태인 경우 다음 단계를 완료합니다.
1. hub 클러스터에서 oc get managedcluster <cluster_name> -o yaml 명령을 실행합니다. & lt;cluster_name >을 클러스터 이름으로 바꿉니다.
2. status.conditions 섹션을 찾습니다.
3. ManagedClusterConditionAvailable 유형의 메시지를 확인하고 모든 문제를 해결합니다.

1.6. 관리형 클러스터 가져오기 실패 문제 해결
링크 복사

클러스터 가져오기에 실패하면 클러스터 가져오기에 실패한 이유를 확인하기 위해 수행할 수 있는 몇 가지 단계가 있습니다.

1.6.1. 증상: 가져온 클러스터를 사용할 수 없음
링크 복사

클러스터 가져오기 절차를 완료한 후에는 Kubernetes 콘솔용 Red Hat Advanced Cluster Management에서 액세스할 수 없습니다.

1.6.2. 문제 해결: 가져온 클러스터를 사용할 수 없음
링크 복사

가져오기를 시도한 후에는 가져온 클러스터를 사용할 수 없는 몇 가지 이유가 있을 수 있습니다. 클러스터 가져오기에 실패하면 가져오기에 실패한 이유를 찾을 때까지 다음 단계를 완료합니다.

Red Hat Advanced Cluster Management Hub 클러스터에서 다음 명령을 실행하여 Red Hat Advanced Cluster Management 가져오기 컨트롤러가 실행 중인지 확인합니다.
```
kubectl -n multicluster-engine get pods -l app=managedcluster-import-controller-v2
```
실행 중인 Pod 두 개가 표시되어야 합니다. Pod 중 하나가 실행 중이 아닌 경우 다음 명령을 실행하여 로그를 확인하여 이유를 확인합니다.
```
kubectl -n multicluster-engine logs -l app=managedcluster-import-controller-v2 --tail=-1
```
Red Hat Advanced Cluster Management Hub 클러스터에서 다음 명령을 실행하여 Red Hat Advanced Cluster Management 가져오기 컨트롤러에서 관리 클러스터 가져오기 보안이 성공적으로 생성되었는지 확인합니다.
```
kubectl -n <managed_cluster_name> get secrets <managed_cluster_name>-import
```
가져오기 보안이 없는 경우 다음 명령을 실행하여 가져오기 컨트롤러의 로그 항목을 보고 생성되지 않은 이유를 확인합니다.
```
kubectl -n multicluster-engine logs -l app=managedcluster-import-controller-v2 --tail=-1 | grep importconfig-controller
```
Red Hat Advanced Cluster Management Hub 클러스터에서 관리 클러스터가 로컬 클러스터 이거나 Hive에서 프로비저닝하거나 자동 가져오기 시크릿이 있는 경우 다음 명령을 실행하여 관리 클러스터의 가져오기 상태를 확인합니다.
```
kubectl get managedcluster <managed_cluster_name> -o=jsonpath='{range .status.conditions[*]}{.type}{"\t"}{.status}{"\t"}{.message}{"\n"}{end}' | grep ManagedClusterImportSucceeded
```
ManagedClusterImportSucceeded 조건이 true 가 아닌 경우 명령의 결과는 실패 이유를 나타냅니다.
성능이 저하된 상태에 대해 관리 클러스터의 Klusterlet 상태를 확인합니다. Klusterlet의 성능이 저하된 이유를 찾으려면 성능이 저하된 Klusterlet 문제 해결을 참조하십시오.

1.7. 가져오기 보류 중 상태의 클러스터 문제 해결
링크 복사

클러스터 콘솔에서 보류 중 가져오기 가 계속되는 경우 절차에 따라 문제를 해결합니다.

1.7.1. 증상: 가져오기 상태가 보류 중인 클러스터
링크 복사

Red Hat Advanced Cluster Management 콘솔을 사용하여 클러스터를 가져온 후 클러스터에 Pending import 상태로 콘솔에 표시됩니다.

1.7.2. 문제 확인: 가져오기 보류 중인 클러스터
링크 복사

관리 클러스터에서 다음 명령을 실행하여 문제가 있는 Kubernetes Pod 이름을 확인합니다.
```
kubectl get pod -n open-cluster-management-agent | grep klusterlet-registration-agent
```
관리 클러스터에서 다음 명령을 실행하여 오류의 로그 항목을 찾습니다.
```
kubectl logs <registration_agent_pod> -n open-cluster-management-agent
```
registration_agent_pod 를 1단계에서 확인한 포드 이름으로 교체합니다.
반환된 결과에 네트워킹 연결 문제가 있음을 나타내는 텍스트를 검색합니다. 예제에는 이러한 호스트가 없습니다.

1.7.3. 문제 해결: 가져오기 보류 중인 클러스터
링크 복사

hub 클러스터에 다음 명령을 입력하여 문제가 있는 포트 번호를 검색합니다.
```
oc get infrastructure cluster -o yaml | grep apiServerURL
```
관리 클러스터의 호스트 이름을 확인할 수 있고 호스트와 포트에 대한 아웃바운드 연결이 발생하는지 확인합니다.
관리 클러스터에서 통신을 설정할 수 없는 경우 클러스터 가져오기가 완료되지 않습니다. 관리 클러스터의 클러스터 상태는 가져오기 보류 중입니다.

1.8. 이미 존재하는 클러스터 문제 해결 오류
링크 복사

OpenShift Container Platform 클러스터를 Red Hat Advanced Cluster Management MultiClusterHub 로 가져올 수 없고 AlreadyExists 오류가 발생하는 경우 다음 절차에 따라 문제를 해결합니다.

1.8.1. 증상: OpenShift Container Platform 클러스터를 가져올 때 오류 로그가 준비됨
링크 복사

OpenShift Container Platform 클러스터를 Red Hat Advanced Cluster Management MultiClusterHub 로 가져올 때 오류 로그가 표시됩니다.

error log:
Warning: apiextensions.k8s.io/v1beta1 CustomResourceDefinition is deprecated in v1.16+, unavailable in v1.22+; use apiextensions.k8s.io/v1 CustomResourceDefinition
Error from server (AlreadyExists): error when creating "STDIN": customresourcedefinitions.apiextensions.k8s.io "klusterlets.operator.open-cluster-management.io" already exists
The cluster cannot be imported because its Klusterlet CRD already exists.
Either the cluster was already imported, or it was not detached completely during a previous detach process.
Detach the existing cluster before trying the import again."

1.8.2. 문제 확인: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.
링크 복사

다음 명령을 실행하여 새 Red Hat Advanced Cluster Management MultiClusterHub 로 가져올 Red Hat Advanced Cluster Management 관련 리소스가 있는지 확인합니다.

oc get all -n open-cluster-management-agent
oc get all -n open-cluster-management-agent-addon

1.8.3. 문제 해결: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.
링크 복사

다음 명령을 사용하여 klusterlet 사용자 정의 리소스를 제거합니다.

oc get klusterlet | grep klusterlet | awk '{print $1}' | xargs oc patch klusterlet --type=merge -p '{"metadata":{"finalizers": []}}'

다음 명령을 실행하여 기존 리소스를 제거합니다.

oc delete namespaces open-cluster-management-agent open-cluster-management-agent-addon --wait=false
oc get crds | grep open-cluster-management.io | awk '{print $1}' | xargs oc delete crds --wait=false
oc get crds | grep open-cluster-management.io | awk '{print $1}' | xargs oc patch crds --type=merge -p '{"metadata":{"finalizers": []}}'

1.9. VMware vSphere에서 클러스터 생성 문제 해결
링크 복사

VMware vSphere에서 Red Hat OpenShift Container Platform 클러스터를 생성할 때 문제가 발생하는 경우 다음 문제 해결 정보를 참조하여 문제가 해결되었는지 확인하십시오.

참고: VMware vSphere에서 클러스터 생성 프로세스가 실패하면 로그를 볼 수 있는 링크가 활성화되어 있지 않을 수 있습니다. 이 경우 hive-controllers Pod의 로그를 확인하여 문제를 식별할 수 있습니다. hive-controllers 로그는 hive 네임스페이스에 있습니다.

1.9.1. 인증서 IP SAN 오류와 함께 관리되는 클러스터 생성 실패
링크 복사

1.9.1.1. 증상: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 클러스터에 인증서 IP SAN 오류를 나타내는 오류 메시지와 함께 실패합니다.

1.9.1.2. 문제 식별: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.
링크 복사

관리 클러스터의 배포가 실패하고 배포 로그에 다음 오류를 반환합니다.

time="2020-08-07T15:27:55Z" level=error msg="Error: error setting up new vSphere SOAP client: Post https://147.1.1.1/sdk: x509: cannot validate certificate for xx.xx.xx.xx because it doesn't contain any IP SANs"
time="2020-08-07T15:27:55Z" level=error

1.9.1.3. 문제 해결: 인증서 IP SAN 오류로 관리되는 클러스터 생성에 실패합니다.
링크 복사

자격 증명의 IP 주소 대신 VMware vCenter 서버 정규화된 호스트 이름을 사용합니다. VMware vCenter CA 인증서를 업데이트하여 IP SAN을 포함할 수도 있습니다.

1.9.2. 알 수 없는 인증 기관으로 관리 클러스터 생성 실패
링크 복사

1.9.2.1. 증상: 관리형 클러스터 생성이 알 수 없는 인증 기관으로 인해 실패함
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성하면 인증서가 알 수 없는 기관에서 서명했기 때문에 클러스터가 실패합니다.

1.9.2.2. 문제 식별: Managed cluster creation fails with unknown certificate authority
링크 복사

관리 클러스터의 배포가 실패하고 배포 로그에 다음 오류를 반환합니다.

Error: error setting up new vSphere SOAP client: Post https://vspherehost.com/sdk: x509: certificate signed by unknown authority"

1.9.2.3. 문제 해결: 알 수 없는 인증 기관을 사용하면 관리형 클러스터 생성이 실패합니다.
링크 복사

인증 정보를 생성할 때 인증 기관에서 올바른 인증서를 입력했는지 확인합니다.

1.9.3. 만료된 인증서로 관리되는 클러스터 생성 실패
링크 복사

1.9.3.1. 증상: 만료된 인증서로 관리 클러스터 생성에 실패합니다.
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 인증서가 만료되거나 유효하지 않기 때문에 클러스터가 실패합니다.

1.9.3.2. 문제 식별: 만료된 인증서로 관리 클러스터 생성이 실패합니다.
링크 복사

관리 클러스터의 배포가 실패하고 배포 로그에 다음 오류를 반환합니다.

x509: certificate has expired or is not yet valid

1.9.3.3. 문제 해결: 만료된 인증서로 관리 클러스터 생성이 실패합니다.
링크 복사

ESXi 호스트의 시간이 동기화되었는지 확인합니다.

1.9.4. 관리 클러스터 생성에 실패하여 태그 지정 권한이 충분하지 않음
링크 복사

1.9.4.1. 증상: 관리형 클러스터 생성이 실패하고 태그 지정 권한이 충분하지 않음
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 태그 지정을 사용할 수 있는 권한이 부족하기 때문에 클러스터가 실패합니다.

1.9.4.2. 문제 식별: 관리형 클러스터 생성이 실패하여 태그 지정 권한이 부족하지 않습니다.
링크 복사

관리 클러스터의 배포가 실패하고 배포 로그에 다음 오류를 반환합니다.

time="2020-08-07T19:41:58Z" level=debug msg="vsphere_tag_category.category: Creating..."
time="2020-08-07T19:41:58Z" level=error
time="2020-08-07T19:41:58Z" level=error msg="Error: could not create category: POST https://vspherehost.com/rest/com/vmware/cis/tagging/category: 403 Forbidden"
time="2020-08-07T19:41:58Z" level=error
time="2020-08-07T19:41:58Z" level=error msg="  on ../tmp/openshift-install-436877649/main.tf line 54, in resource \"vsphere_tag_category\" \"category\":"
time="2020-08-07T19:41:58Z" level=error msg="  54: resource \"vsphere_tag_category\" \"category\" {"

1.9.4.3. 문제 해결: 태그 지정에 대한 권한이 부족하여 관리되는 클러스터 생성이 실패합니다.
링크 복사

VMware vCenter 필수 계정 권한이 올바른지 확인합니다. 자세한 내용은 이미지 레지스트리 를 참조하십시오.

1.9.5. 관리 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

1.9.5.1. 증상: 관리형 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 잘못된 dnsVIP가 있으므로 클러스터가 실패합니다.

1.9.5.2. 문제 식별: Managed 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

VMware vSphere를 사용하여 새 관리 클러스터를 배포하려고 할 때 다음 메시지가 표시되면 VMware 설치 관리자 프로비저닝 인프라(IPI)를 지원하지 않는 이전 OpenShift Container Platform 릴리스 이미지가 있기 때문입니다.

failed to fetch Master Machines: failed to load asset \\\"Install Config\\\": invalid \\\"install-config.yaml\\\" file: platform.vsphere.dnsVIP: Invalid value: \\\"\\\": \\\"\\\" is not a valid IP

1.9.5.3. 문제 해결: 잘못된 dnsVIP와 함께 관리 클러스터 생성이 실패합니다.
링크 복사

VMware 설치 관리자 프로비저닝 인프라를 지원하는 이후 버전의 OpenShift Container Platform에서 릴리스 이미지를 선택합니다.

1.9.6. 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.
링크 복사

1.9.6.1. 증상: 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 잘못된 네트워크 유형이 지정되어 있으므로 클러스터가 실패합니다.

1.9.6.2. 문제 식별: Managed cluster creation fails with incorrect network type
링크 복사

VMware vSphere를 사용하여 새 관리 클러스터를 배포하려고 할 때 다음 메시지가 표시되면 VMware Installer Provisioned Infrastructure (IPI)를 지원하지 않는 이전 OpenShift Container Platform 이미지가 있기 때문입니다.

time="2020-08-11T14:31:38-04:00" level=debug msg="vsphereprivate_import_ova.import: Creating..."
time="2020-08-11T14:31:39-04:00" level=error
time="2020-08-11T14:31:39-04:00" level=error msg="Error: rpc error: code = Unavailable desc = transport is closing"
time="2020-08-11T14:31:39-04:00" level=error
time="2020-08-11T14:31:39-04:00" level=error
time="2020-08-11T14:31:39-04:00" level=fatal msg="failed to fetch Cluster: failed to generate asset \"Cluster\": failed to create cluster: failed to apply Terraform: failed to complete the change"

1.9.6.3. 문제 해결: 관리형 클러스터 생성이 잘못된 네트워크 유형으로 인해 실패합니다.
링크 복사

지정된 VMware 클러스터에 유효한 VMware vSphere 네트워크 유형을 선택합니다.

1.9.7. 디스크 처리 디스크 변경 오류와 함께 관리되는 클러스터 생성 실패
링크 복사

1.9.7.1. 증상: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터 추가 실패
링크 복사

VMware vSphere에서 새 Red Hat OpenShift Container Platform 클러스터를 생성한 후 디스크 변경 사항을 처리할 때 오류가 있기 때문에 클러스터가 실패합니다.

1.9.7.2. 문제 식별: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다
링크 복사

다음과 유사한 메시지가 로그에 표시됩니다.

ERROR
ERROR Error: error reconfiguring virtual machine: error processing disk changes post-clone: disk.0: ServerFaultCode: NoPermission: RESOURCE (vm-71:2000), ACTION (queryAssociatedProfile): RESOURCE (vm-71), ACTION (PolicyIDByVirtualDisk)

1.9.7.3. 문제 해결: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다
링크 복사

VMware vSphere 클라이언트를 사용하여 프로파일 중심 스토리지 권한에 대한 모든 권한을 사용자에게 부여합니다.

1.10. 알 수 없는 권한 오류로 Red Hat OpenStack Platform에서 관리형 클러스터 생성 문제 해결 실패
링크 복사

Red Hat OpenStack Platform에서 Red Hat OpenShift Container Platform 클러스터를 생성할 때 문제가 발생하는 경우 다음 문제 해결 정보를 참조하여 문제가 해결되었는지 확인하십시오.

1.10.1. 증상: 관리형 클러스터 생성에 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

자체 서명된 인증서를 사용하여 Red Hat OpenStack Platform에서 새 Red Hat OpenShift Container Platform 클러스터를 생성하면 알 수 없는 권한 오류를 나타내는 오류 메시지와 함께 클러스터가 실패합니다.

1.10.2. 문제 식별: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

관리 클러스터의 배포가 실패하고 다음 오류 메시지를 반환합니다.

x509: 알 수 없는 기관에서 서명한 인증서

1.10.3. 문제 해결: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

다음 파일이 올바르게 구성되었는지 확인합니다.

clouds.yaml 파일은 cacert 매개변수의 ca.crt 파일의 경로를 지정해야 합니다. cacert 매개변수는 ignition shim을 생성할 때 OpenShift 설치 프로그램에 전달됩니다. 다음 예제를 참조하십시오.
```
clouds:
  openstack:
    cacert: "/etc/pki/ca-trust/source/anchors/ca.crt"
```

certificatesSecretRef 매개변수는 ca.crt 파일과 일치하는 파일 이름이 있는 시크릿을 참조해야 합니다. 다음 예제를 참조하십시오.

spec:
  baseDomain: dev09.red-chesterfield.com
  clusterName: txue-osspoke
  platform:
    openstack:
      cloud: openstack
      credentialsSecretRef:
        name: txue-osspoke-openstack-creds
      certificatesSecretRef:
        name: txue-osspoke-openstack-certificatebundle

일치하는 파일 이름으로 보안을 생성하려면 다음 명령을 실행합니다.

oc create secret generic txue-osspoke-openstack-certificatebundle --from-file=ca.crt=ca.crt.pem -n $CLUSTERNAME

ca.cert 파일의 크기는 631,000바이트 미만이어야 합니다.

1.11. 인증서 변경 후 가져온 클러스터 오프라인 문제 해결
링크 복사

사용자 정의 apiserver 인증서 설치가 지원되지만 인증서 정보를 변경하기 전에 가져온 하나 이상의 클러스터는 오프라인 상태입니다.

1.11.1. 증상: 인증서 변경 후 오프라인 클러스터
링크 복사

인증서 보안 업데이트 절차를 완료한 후 온라인 클러스터 중 하나 이상에 이제 콘솔에 오프라인 상태가 표시됩니다.

1.11.2. 문제 식별: 인증서 변경 후 오프라인 클러스터
링크 복사

사용자 정의 API 서버 인증서에 대한 정보를 업데이트한 후 새 인증서가 이제 오프라인 상태가 되기 전에 가져온 클러스터입니다.

인증서가 문제가 있음을 나타내는 오류는 오프라인 관리 클러스터의 open-cluster-management-agent 네임스페이스에 있는 Pod 로그에서 확인할 수 있습니다. 다음 예제는 로그에 표시되는 오류와 유사합니다.

다음 work-agent 로그를 참조하십시오.

E0917 03:04:05.874759       1 manifestwork_controller.go:179] Reconcile work test-1-klusterlet-addon-workmgr fails with err: Failed to update work status with err Get "https://api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/namespaces/test-1/manifestworks/test-1-klusterlet-addon-workmgr": x509: certificate signed by unknown authority
E0917 03:04:05.874887       1 base_controller.go:231] "ManifestWorkAgent" controller failed to sync "test-1-klusterlet-addon-workmgr", err: Failed to update work status with err Get "api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/namespaces/test-1/manifestworks/test-1-klusterlet-addon-workmgr": x509: certificate signed by unknown authority
E0917 03:04:37.245859       1 reflector.go:127] k8s.io/client-go@v0.19.0/tools/cache/reflector.go:156: Failed to watch *v1.ManifestWork: failed to list *v1.ManifestWork: Get "api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/namespaces/test-1/manifestworks?resourceVersion=607424": x509: certificate signed by unknown authority

다음 registration-agent 로그를 참조하십시오.

I0917 02:27:41.525026       1 event.go:282] Event(v1.ObjectReference{Kind:"Namespace", Namespace:"open-cluster-management-agent", Name:"open-cluster-management-agent", UID:"", APIVersion:"v1", ResourceVersion:"", FieldPath:""}): type: 'Normal' reason: 'ManagedClusterAvailableConditionUpdated' update managed cluster "test-1" available condition to "True", due to "Managed cluster is available"
E0917 02:58:26.315984       1 reflector.go:127] k8s.io/client-go@v0.19.0/tools/cache/reflector.go:156: Failed to watch *v1beta1.CertificateSigningRequest: Get "https://api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/managedclusters?allowWatchBookmarks=true&fieldSelector=metadata.name%3Dtest-1&resourceVersion=607408&timeout=9m33s&timeoutSeconds=573&watch=true"": x509: certificate signed by unknown authority
E0917 02:58:26.598343       1 reflector.go:127] k8s.io/client-go@v0.19.0/tools/cache/reflector.go:156: Failed to watch *v1.ManagedCluster: Get "https://api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/managedclusters?allowWatchBookmarks=true&fieldSelector=metadata.name%3Dtest-1&resourceVersion=607408&timeout=9m33s&timeoutSeconds=573&watch=true": x509: certificate signed by unknown authority
E0917 02:58:27.613963       1 reflector.go:127] k8s.io/client-go@v0.19.0/tools/cache/reflector.go:156: Failed to watch *v1.ManagedCluster: failed to list *v1.ManagedCluster: Get "https://api.aaa-ocp.dev02.location.com:6443/apis/cluster.management.io/v1/managedclusters?allowWatchBookmarks=true&fieldSelector=metadata.name%3Dtest-1&resourceVersion=607408&timeout=9m33s&timeoutSeconds=573&watch=true"": x509: certificate signed by unknown authority

1.11.3. 문제 해결: 인증서 변경 후 오프라인 클러스터
링크 복사

관리 클러스터가 로컬 클러스터 이거나 Red Hat Advanced Cluster Management for Kubernetes를 사용하여 관리되는 클러스터를 생성한 경우 관리 클러스터를 다시 가져오는 데 10분 이상 기다려야 합니다.

관리 클러스터를 즉시 다시 가져오려면 hub 클러스터에서 관리 클러스터 가져오기 보안을 삭제하고 Red Hat Advanced Cluster Management를 사용하여 다시 가져올 수 있습니다. 다음 명령을 실행합니다.

oc delete secret -n <cluster_name> <cluster_name>-import

& lt;cluster_name >을 가져올 관리 클러스터의 이름으로 바꿉니다.

Red Hat Advanced Cluster Management를 사용하여 가져온 관리형 클러스터를 다시 가져오려면 다음 단계를 완료하여 관리 클러스터를 다시 가져옵니다.

hub 클러스터에서 다음 명령을 실행하여 관리 클러스터 가져오기 보안을 다시 생성합니다.
```
oc delete secret -n <cluster_name> <cluster_name>-import
```
& lt;cluster_name >을 가져올 관리 클러스터의 이름으로 바꿉니다.
허브 클러스터에서 다음 명령을 실행하여 관리 클러스터 가져오기 보안을 YAML 파일에 노출합니다.
```
oc get secret -n <cluster_name> <cluster_name>-import -ojsonpath='{.data.import\.yaml}' | base64 --decode  > import.yaml
```
& lt;cluster_name >을 가져올 관리 클러스터의 이름으로 바꿉니다.
관리 클러스터에서 다음 명령을 실행하여 import.yaml 파일을 적용합니다.
```
oc apply -f import.yaml
```

참고: 이전 단계에서는 hub 클러스터에서 관리 클러스터를 분리하지 않습니다. 이 단계에서는 새 인증서 정보를 포함하여 관리 클러스터의 현재 설정으로 필요한 매니페스트를 업데이트합니다.

1.12. 클러스터를 삭제한 후에도 네임스페이스가 남아 있음
링크 복사

관리 클러스터를 제거하면 일반적으로 네임스페이스가 클러스터 제거 프로세스의 일부로 제거됩니다. 드문 경우지만 네임스페이스에 일부 아티팩트가 남아 있습니다. 이 경우 네임스페이스를 수동으로 제거해야 합니다.

1.12.1. 증상: 클러스터를 삭제한 후에도 네임스페이스가 유지됩니다.
링크 복사

관리 클러스터를 제거한 후 네임스페이스는 제거되지 않습니다.

1.12.2. 문제 해결: 클러스터를 삭제한 후에도 네임스페이스가 남아 있습니다.
링크 복사

네임스페이스를 수동으로 제거하려면 다음 단계를 완료합니다.

다음 명령을 실행하여 <cluster_name> 네임스페이스에 남아 있는 리소스 목록을 생성합니다.

oc api-resources --verbs=list --namespaced -o name | grep -E '^secrets|^serviceaccounts|^managedclusteraddons|^roles|^rolebindings|^manifestworks|^leases|^managedclusterinfo|^appliedmanifestworks'|^clusteroauths' | xargs -n 1 oc get --show-kind --ignore-not-found -n <cluster_name>

cluster_name 을 제거하려는 클러스터의 네임스페이스 이름으로 교체합니다.

다음 명령을 입력하여 목록을 편집하여 Delete 상태가 없는 목록에서 식별된 각 리소스를 삭제합니다.
```
oc edit <resource_kind> <resource_name> -n <namespace>
```
resource_kind 를 리소스 종류로 바꿉니다. resource_name 을 리소스 이름으로 교체합니다. namespace 를 리소스의 네임스페이스 이름으로 교체합니다.
메타데이터에서 종료자 속성을 찾습니다.
vi 편집기 dd 명령을 사용하여 Kubernetes가 아닌 종료자를 삭제합니다.
목록을 저장하고 :wq 명령을 입력하여 vi 편집기를 종료합니다.
다음 명령을 입력하여 네임스페이스를 삭제합니다.
```
oc delete ns <cluster-name>
```
cluster-name 을 삭제하려는 네임스페이스 이름으로 교체합니다.

1.13. 클러스터를 가져올 때 auto-import-secret-exists 오류
링크 복사

자동 가져오기 보안이라는 오류 메시지와 함께 클러스터 가져오기가 실패합니다.

1.13.1. 증상: 클러스터를 가져올 때 자동 가져오기 보안 오류가 발생했습니다
링크 복사

관리를 위해 하이브 클러스터를 가져올 때 자동 가져오기 보안 오류가 이미 표시됩니다.

1.13.2. 문제 해결: 클러스터를 가져올 때 Auto-import-secret-exists 오류
링크 복사

이 문제는 Red Hat Advanced Cluster Management에서 이전에 관리하는 클러스터를 가져오려고 할 때 발생합니다. 이 경우 클러스터를 다시 가져오려고 할 때 보안이 충돌합니다.

이 문제를 해결하려면 다음 단계를 완료하십시오.

기존 auto-import-secret 을 수동으로 삭제하려면 hub 클러스터에서 다음 명령을 실행합니다.
```
oc delete secret auto-import-secret -n <cluster-namespace>
```
cluster-namespace 를 클러스터의 네임스페이스로 바꿉니다.
클러스터 가져오기 소개의 절차를 사용하여 클러스터를 다시 가져옵니다.

1.14. volSync용 CSI(Container Storage Interface) 드라이버 문제 해결
링크 복사

reflectSync를 사용하거나 CSI( cinder Container Storage Interface) 드라이버에서 기본 설정을 사용하는 경우 사용 중인 PVC에 오류가 발생할 수 있습니다.

1.14.1. 증상: Volumesnapshot 오류 상태
링크 복사

스냅샷을 사용하도록 EgressSync ReplicationSource 또는 ReplicationDestination 을 구성할 수 있습니다. 또한 ReplicationSource 및 ReplicationDestination 에서 storageclass 및 volumesnapshotclass 를 구성할 수 있습니다. 값이 false 인 force-create 라는 cinder volumesnapshotclass 에 매개 변수가 있습니다. volumesnapshotclass 의 이 force-create 매개변수는 cinder가 volumesnapshot 을 사용 중인 PVC를 사용하도록 허용하지 않음을 의미합니다. 결과적으로 volumesnapshot 이 오류 상태입니다.

1.14.2. 문제 해결: 매개변수를 true로 설정
링크 복사

cinder CSI 드라이버의 새 volumesnapshotclass 를 만듭니다.

paramater, force-create 를 true 로 변경합니다. 다음 샘플 YAML을 참조하십시오.

apiVersion: snapshot.storage.k8s.io/v1
deletionPolicy: Delete
driver: cinder.csi.openstack.org
kind: VolumeSnapshotClass
metadata:
  annotations:
    snapshot.storage.kubernetes.io/is-default-class: 'true'
  name: standard-csi
parameters:
  force-create: 'true'

1.15. must-gather 명령 문제 해결
링크 복사

1.15.1. 증상: 다중 클러스터 글로벌 허브가 있는 오류
링크 복사

다중 클러스터 글로벌 허브에 다양한 오류가 발생할 수 있습니다. must-gather 명령을 실행하여 다중 클러스터 글로벌 허브와 관련된 문제를 해결할 수 있습니다.

1.15.2. 문제 해결: 중복을 위해 must-gather 명령 실행
링크 복사

must-gather 명령을 실행하여 세부 정보, 로그 및 디버깅 문제 단계를 수집합니다. 이 디버깅 정보는 지원 요청을 열 때 유용합니다. oc adm must-gather CLI 명령은 다음을 포함하여 문제를 디버깅하는 데 종종 필요한 정보를 클러스터에서 수집합니다.

리소스 정의
서비스 로그

1.15.2.1. 사전 요구 사항
링크 복사

must-gather 명령을 실행하려면 다음 사전 요구 사항을 충족해야 합니다.

cluster-admin 역할의 사용자로 글로벌 허브 및 관리 허브 클러스터에 액세스할 수 있습니다.
OpenShift Container Platform CLI(oc)가 설치되어 있어야 합니다.

1.15.2.2. must-gather 명령 실행
링크 복사

must-gather 명령을 사용하여 정보를 수집하려면 다음 절차를 완료합니다.

must-gather 명령에 대해 알아보고 OpenShift Container Platform 설명서에서 클러스터에 대한 데이터 수집 데이터를 읽고 필요한 사전 요구 사항을 설치합니다.
글로벌 허브 클러스터에 로그인합니다. 일반적인 사용 사례는 글로벌 허브 클러스터에 로그인하는 동안 다음 명령을 실행합니다.
```
oc adm must-gather --image=quay.io/stolostron/must-gather:SNAPSHOTNAME
```
관리 허브 클러스터를 확인하려면 해당 클러스터에서 must-gather 명령을 실행합니다.
선택 사항: SOMENAME 디렉터리에 결과를 저장하려면 이전 단계의 명령 대신 다음 명령을 실행할 수 있습니다.
```
oc adm must-gather --image=quay.io/stolostron/must-gather:SNAPSHOTNAME --dest-dir=<SOMENAME> ; tar -cvzf <SOMENAME>.tgz <SOMENAME>
```
디렉터리의 다른 이름을 지정할 수 있습니다.
참고: 이 명령에는 gzipped tarball 파일을 만드는 데 필요한 추가 기능이 포함되어 있습니다.

must-gather 명령에서 다음 정보가 수집됩니다.

두 개의 피어 수준: cluster-scoped-resources 및 namespace resources.
각 하위 수준: 클러스터 범위 및 네임스페이스 범위 리소스 모두에 대한 사용자 정의 리소스 정의에 대한 API 그룹입니다.
각 YAML 파일의 다음 수준: 종류별로 정렬됩니다.
글로벌 허브 클러스터의 경우 네임스페이스 리소스에서 PostgresCluster 및 Kafka 를 확인할 수 있습니다.
글로벌 허브 클러스터의 경우 다중 클러스터 글로벌 허브 관련 Pod를 확인하고 네임스페이스 리소스의 Pod 에서 로그를 확인할 수 있습니다.
관리 허브 클러스터의 경우 다중 클러스터 글로벌 허브 에이전트 Pod를 확인하고 네임스페이스 리소스의 Pod 에 로그인할 수 있습니다.

1.16. PostgreSQL 데이터베이스에 액세스하여 문제 해결
링크 복사

1.16.1. 증상: 다중 클러스터 글로벌 허브가 있는 오류
링크 복사

다중 클러스터 글로벌 허브에 다양한 오류가 발생할 수 있습니다. 프로비저닝된 PostgreSQL 데이터베이스에 액세스하여 다중 클러스터 글로벌 허브 문제 해결에 도움이 될 수 있는 메시지를 볼 수 있습니다.

1.16.2. 문제 해결: PostgresSQL 데이터베이스 액세스
링크 복사

There are two ways to access the provisioned PostgreSQL database.

ClusterIP 서비스 사용

oc exec -it multicluster-global-hub-postgres-0 -c multicluster-global-hub-postgres -n multicluster-global-hub -- psql -U postgres -d hoh

# Or access the database installed by crunchy operator
oc exec -it $(kubectl get pods -n multicluster-global-hub -l postgres-operator.crunchydata.com/role=master -o jsonpath='{.items..metadata.name}') -c database -n multicluster-global-hub -- psql -U postgres -d hoh -c "SELECT 1"

LoadBalancer

기본적으로 프로비저닝된 LoadBalancer 에 서비스 유형을 노출합니다.

cat <<EOF | oc apply -f -
apiVersion: v1
kind: Service
metadata:
  name: multicluster-global-hub-postgres-lb
  namespace: multicluster-global-hub
spec:
  ports:
  - name: postgres
    port: 5432
    protocol: TCP
    targetPort: 5432
  selector:
    name: multicluster-global-hub-postgres
  type: LoadBalancer
EOF

다음 명령을 실행하여 인증 정보를 가져옵니다.

# Host
oc get svc postgres-ha -ojsonpath='{.status.loadBalancer.ingress[0].hostname}'

# Password
oc get secrets -n multicluster-global-hub postgres-pguser-postgres -o go-template='{{index (.data) "password" | base64decode}}'

crunchy Operator가 프로비저닝한 LoadBalancer 에 서비스 유형을 노출합니다.

oc patch postgrescluster postgres -n multicluster-global-hub -p '{"spec":{"service":{"type":"LoadBalancer"}}}'  --type merge

다음 명령을 실행하여 인증 정보를 가져옵니다.

# Host
oc get svc -n multicluster-global-hub postgres-ha -ojsonpath='{.status.loadBalancer.ingress[0].hostname}'

# Username
oc get secrets -n multicluster-global-hub postgres-pguser-postgres -o go-template='{{index (.data) "user" | base64decode}}'

# Password
oc get secrets -n multicluster-global-hub postgres-pguser-postgres -o go-template='{{index (.data) "password" | base64decode}}'

# Database
oc get secrets -n multicluster-global-hub postgres-pguser-postgres -o go-template='{{index (.data) "dbname" | base64decode}}'

1.17. 데이터베이스 덤프 및 복원을 사용하여 문제 해결
링크 복사

프로덕션 환경에서는 PostgreSQL 데이터베이스를 정기적으로 데이터베이스 관리 작업으로 백업합니다. 백업을 사용하여 다중 클러스터 글로벌 허브를 디버깅할 수도 있습니다.

1.17.1. 증상: 다중 클러스터 글로벌 허브가 있는 오류
링크 복사

다중 클러스터 글로벌 허브에 다양한 오류가 발생할 수 있습니다. 다중 클러스터 글로벌 허브의 문제 해결에 데이터베이스 덤프 및 복원을 사용할 수 있습니다.

1.17.2. 문제 해결: 중복을 위해 데이터베이스의 출력 덤프
링크 복사

multicluster 글로벌 허브 데이터베이스의 출력을 덤프하여 문제를 디버깅하는 경우가 있습니다. PostgreSQL 데이터베이스는 데이터베이스 콘텐츠를 덤프하는 pg_dump 명령줄 툴을 제공합니다. localhost 데이터베이스 서버에서 데이터를 덤프하려면 다음 명령을 실행합니다.

pg_dump hoh > hoh.sql

압축 형식이 있는 원격 서버에 있는 다중 클러스터 글로벌 허브 데이터베이스를 덤프하려면 다음 예와 같이 명령줄 옵션을 사용하여 연결 세부 정보를 제어합니다.

pg_dump -h my.host.com -p 5432 -U postgres -F t hoh -f hoh-$(date +%d-%m-%y_%H-%M).tar

1.17.3. 문제 해결: 덤프에서 데이터베이스 복원
링크 복사

PostgreSQL 데이터베이스를 복원하려면 psql 또는 pg_restore 명령줄 툴을 사용할 수 있습니다. psql 툴은 pg_dump 로 생성된 일반 텍스트 파일을 복원하는 데 사용됩니다.

psql -h another.host.com -p 5432 -U postgres -d hoh < hoh.sql

pg_restore 툴은 pg_dump 가 아닌 텍스트 형식(custom, tar 또는 directory) 중 하나로 생성된 아카이브에서 PostgreSQL 데이터베이스를 복원하는 데 사용됩니다.

pg_restore -h another.host.com -p 5432 -U postgres -d hoh hoh-$(date +%d-%m-%y_%H-%M).tar

1.18. 클러스터 상태가 오프라인에서 사용 가능으로 변경 문제 해결
링크 복사

관리 클러스터의 상태는 환경 또는 클러스터를 수동으로 변경하지 않고 오프라인에서 사용 가능한 상태로 변경됩니다.

1.18.1. 증상: 클러스터 상태가 오프라인에서 사용 가능으로 변경
링크 복사

관리 클러스터를 허브 클러스터에 연결하는 네트워크가 불안정한 경우 허브 클러스터 사이클에 의해 오프라인 과 사용 가능 으로 보고되는 관리 클러스터의 상태가 불안정합니다.

허브 클러스터와 관리형 클러스터 간의 연결은 leaseDurationSeconds 간격 값에 유효한 리스를 통해 유지 관리됩니다. leaseDurationSeconds 값의 5번 연속 시도 내에서 리스를 검증하지 않으면 클러스터가 오프라인으로 표시됩니다.

예를 들어, 리스DurationSeconds 간격이 60초 인 5분 후에 클러스터가 오프라인 상태로 표시됩니다. 이 구성은 연결 문제 또는 대기 시간과 같은 이유로 부적절하여 불안정성을 유발할 수 있습니다.

1.18.2. 문제 해결: 클러스터 상태가 오프라인에서 사용 가능으로 변경
링크 복사

5개의 검증 시도는 기본값이며 변경할 수 없지만 leaseDurationSeconds 간격을 변경할 수 있습니다.

클러스터를 오프라인으로 표시할 시간(분)을 확인한 다음 해당 값을 60으로 곱하여 초로 변환합니다. 그런 다음 기본 5개의 시도로 나눕니다. 그 결과 리스DurationSeconds 값이 됩니다.

다음 명령을 입력하여 hub 클러스터에서 ManagedCluster 사양을 편집하지만 cluster-name 을 관리 클러스터 이름으로 교체합니다.
```
oc edit managedcluster <cluster-name>
```

다음 샘플 YAML에 표시된 대로 ManagedCluster 사양에서 leaseDurationSeconds 값을 늘립니다.

apiVersion: cluster.open-cluster-management.io/v1
kind: ManagedCluster
metadata:
  name: <cluster-name>
spec:
  hubAcceptsClient: true
  leaseDurationSeconds: 60

파일을 저장하고 적용합니다.

1.19. 보류 중 또는 실패 상태의 콘솔에서 클러스터 문제 해결
링크 복사

생성한 클러스터의 콘솔에서 Pending 상태 또는 실패 상태를 모니터링하는 경우 절차를 수행하여 문제를 해결합니다.

1.19.1. 증상: 보류 중이거나 실패한 콘솔의 클러스터
링크 복사

Red Hat Advanced Cluster Management for Kubernetes 콘솔을 사용하여 새 클러스터를 생성한 후 클러스터는 Pending 상태를 초과하지 않거나 Failed 상태를 표시합니다.

1.19.2. 문제 식별: 보류 중이거나 실패한 콘솔의 클러스터
링크 복사

클러스터에 Failed 상태가 표시되면 클러스터의 세부 정보 페이지로 이동하여 제공된 로그 링크를 따릅니다. 로그를 찾을 수 없거나 클러스터에 Pending 상태가 표시되면 다음 절차를 계속 실행하여 로그를 확인합니다.

절차 1
1. 허브 클러스터에서 다음 명령을 실행하여 새 클러스터의 네임스페이스에 생성된 Kubernetes Pod의 이름을 확인합니다.
  oc get pod -n <new_cluster_name>
  new_cluster_name 을 생성한 클러스터 이름으로 교체합니다.
2. 이름에 provision 문자열이 포함된 Pod가 나열되지 않은 경우 Procedure 2를 계속합니다. 제목에 프로비저닝 이 있는 Pod가 있는 경우 허브 클러스터에서 다음 명령을 실행하여 해당 Pod의 로그를 확인합니다.
  oc logs <new_cluster_name_provision_pod_name> -n <new_cluster_name> -c hive
  new_cluster_name_provision_pod_name 을 생성한 클러스터 이름 및 프로비저닝이 포함된 포드 이름으로 교체 합니다.
3. 문제의 원인을 설명할 수 있는 로그에서 오류를 검색합니다.
절차 2
이름이 provision 인 Pod가 없는 경우 프로세스 초기에 문제가 발생했습니다. 로그를 보려면 다음 절차를 완료합니다.
1. hub 클러스터에서 다음 명령을 실행합니다.
  oc describe clusterdeployments -n <new_cluster_name>
  new_cluster_name 을 생성한 클러스터 이름으로 교체합니다. 클러스터 설치 로그에 대한 자세한 내용은 Red Hat OpenShift 설명서의 설치 로그 수집을 참조하십시오.
2. 리소스의 Status.Conditions.Message 및 Status.Conditions.Reason 항목에서 문제에 대한 추가 정보가 있는지 확인하십시오.

1.19.3. 문제 해결: 보류 중이거나 실패한 콘솔의 클러스터
링크 복사

로그에서 오류를 확인한 후 클러스터를 제거하고 다시 생성하기 전에 오류를 해결하는 방법을 확인합니다.

다음 예제에서는 지원되지 않는 영역을 선택할 때 발생할 수 있는 로그 오류와 이를 해결하는 데 필요한 작업을 제공합니다.

No subnets provided for zones

클러스터를 생성할 때 지원되지 않는 리전 내에서 하나 이상의 영역을 선택했습니다. 클러스터를 재생성하여 문제를 해결할 때 다음 작업 중 하나를 완료합니다.

지역 내에서 다른 영역을 선택합니다.
다른 영역이 나열된 경우 지원을 제공하지 않는 영역을 생략합니다.
클러스터의 다른 리전을 선택합니다.

로그에서 문제를 확인한 후 클러스터를 제거하고 다시 생성합니다.

클러스터 생성에 대한 자세한 내용은 클러스터 생성 을 참조하십시오.

1.20. Grafana 문제 해결
링크 복사

Grafana 탐색기에서 시간이 많이 걸리는 메트릭을 쿼리할 때 게이트웨이 시간 제한 오류가 발생할 수 있습니다.

1.20.1. 증상: Grafana explorer 게이트웨이 시간 초과
링크 복사

Grafana explorer에서 시간이 많이 걸리는 메트릭을 쿼리할 때 게이트웨이 시간 제한 오류가 발생하면 open-cluster-management-observability 네임스페이스의 Grafana로 인해 시간 초과가 발생할 수 있습니다.

1.20.2. 문제 해결: Grafana 구성
링크 복사

이 문제가 있는 경우 다음 단계를 완료합니다.

Grafana의 기본 구성에 예상 시간 제한 설정이 있는지 확인합니다.
1. Grafana의 기본 시간 초과 설정을 확인하려면 다음 명령을 실행합니다.
  oc get secret grafana-config -n open-cluster-management-observability -o jsonpath="{.data.grafana\.ini}" | base64 -d | grep dataproxy -A 4
  다음 시간 초과 설정이 표시되어야 합니다.
  [dataproxy] timeout = 300 dial_timeout = 30 keep_alive_seconds = 300
2. Grafana에 대한 기본 데이터 소스 쿼리 타임아웃을 확인하려면 다음 명령을 실행합니다.
  oc get secret/grafana-datasources -n open-cluster-management-observability -o jsonpath="{.data.datasources\.yaml}" | base64 -d | grep queryTimeout
  다음 시간 초과 설정이 표시되어야 합니다.
  queryTimeout: 300s
Grafana의 기본 구성에 예상 시간 제한 설정이 있는 경우 다음 명령을 실행하여 open-cluster-management-observability 네임스페이스에서 Grafana를 구성할 수 있습니다.
```
oc annotate route grafana -n open-cluster-management-observability --overwrite haproxy.router.openshift.io/timeout=300s
```

Grafana 페이지를 새로 고치고 메트릭을 다시 쿼리합니다. 게이트웨이 시간 제한 오류가 더 이상 표시되지 않습니다.

1.21. 배치 규칙을 사용하여 선택하지 않은 로컬 클러스터 문제 해결
링크 복사

관리 클러스터는 배치 규칙으로 선택되지만, 또한 관리하는 허브 클러스터인 local-cluster 는 선택되지 않습니다. 배치 규칙 사용자에게는 local-cluster 네임스페이스에서 관리 클러스터 리소스를 가져올 수 있는 권한이 부여되지 않습니다.

1.21.1. 증상: 관리형 클러스터로 선택되지 않은 로컬 클러스터 문제 해결
링크 복사

모든 관리 클러스터는 배치 규칙으로 선택되지만 local-cluster 는 그렇지 않습니다. 배치 규칙 사용자에게는 local-cluster 네임스페이스에서 관리 클러스터 리소스를 가져올 수 있는 권한이 부여되지 않습니다.

1.21.2. 문제 해결: 관리형 클러스터로 선택되지 않은 로컬 클러스터 문제 해결
링크 복사

더 이상 사용되지 않음: PlacementRule

이 문제를 해결하려면 local-cluster 네임스페이스에서 managedcluster 관리 권한을 부여해야 합니다. 다음 단계를 완료합니다.

관리 클러스터 목록에 local-cluster 가 포함되어 있고 배치 규칙 결정 목록에 local-cluster 가 표시되지 않는지 확인합니다. 다음 명령을 실행하여 결과를 확인합니다.

% oc get managedclusters

local-cluster 가 결합되었지만 PlacementRule 의 YAML에 없는 샘플 출력에서 참조하십시오.

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS   JOINED   AVAILABLE   AGE
local-cluster   true                                  True     True        56d
cluster1        true                                  True     True        16h

apiVersion: apps.open-cluster-management.io/v1
kind: PlacementRule
metadata:
  name: all-ready-clusters
  namespace: default
spec:
  clusterSelector: {}
status:
  decisions:
  - clusterName: cluster1
    clusterNamespace: cluster1

YAML 파일에 역할을 생성하여 local-cluster 네임스페이스에서 managedcluster 관리 권한을 부여합니다. 다음 예제를 참조하십시오.

apiVersion: rbac.authorization.k8s.io/v1
kind: Role
metadata:
  name: managedcluster-admin-user-zisis
  namespace: local-cluster
rules:
- apiGroups:
  - cluster.open-cluster-management.io
  resources:
  - managedclusters
  verbs:
  - get

RoleBinding 리소스를 생성하여 배치 규칙 사용자에게 local-cluster 네임스페이스에 대한 액세스 권한을 부여합니다. 다음 예제를 참조하십시오.

apiVersion: rbac.authorization.k8s.io/v1
kind: RoleBinding
metadata:
  name: managedcluster-admin-user-zisis
  namespace: local-cluster
roleRef:
  apiGroup: rbac.authorization.k8s.io
  kind: Role
  name: managedcluster-admin-user-zisis
  namespace: local-cluster
subjects:
- kind: User
  name: zisis
  apiGroup: rbac.authorization.k8s.io

1.22. 애플리케이션 Kubernetes 배포 버전 문제 해결
링크 복사

더 이상 사용되지 않는 Kubernetes apiVersion 이 있는 관리형 클러스터는 지원되지 않을 수 있습니다. 더 이상 사용되지 않는 API 버전에 대한 자세한 내용은 Kubernetes 문제를 참조하십시오.

1.22.1. 증상: 애플리케이션 배포 버전
링크 복사

Subscription YAML 파일에서 하나 이상의 애플리케이션 리소스가 더 이상 사용되지 않는 API를 사용하는 경우 다음 오류와 유사한 오류가 표시될 수 있습니다.

failed to install release: unable to build kubernetes objects from release manifest: unable to recognize "": no matches for
kind "Deployment" in version "extensions/v1beta1"

또는 인스턴스의 경우 이름이 old.yaml 인 YAML 파일의 새 Kubernetes API 버전이 있으면 다음과 같은 오류가 발생할 수 있습니다.

error: unable to recognize "old.yaml": no matches for kind "Deployment" in version "deployment/v1beta1"

1.22.2. 문제 해결: 애플리케이션 배포 버전
링크 복사

리소스에서 apiVersion 을 업데이트합니다. 예를 들어 서브스크립션 YAML 파일에 배포 유형에 대한 오류가 표시되면 extensions/v1beta1 에서 apps/v1 로 apiVersion 을 업데이트해야 합니다.
다음 예제를 참조하십시오.
```
apiVersion: apps/v1
kind: Deployment
```
관리 클러스터에서 다음 명령을 실행하여 사용 가능한 버전을 확인합니다.
```
kubectl explain <resource>
```
VERSION 을 확인합니다.

1.23. 성능이 저하된 조건으로 Klusterlet 문제 해결
링크 복사

Klusterlet 성능이 저하된 조건은 관리 클러스터에서 Klusterlet 에이전트의 상태를 진단하는 데 도움이 될 수 있습니다. Klusterlet이 성능 저하된 상태에 있는 경우 관리 클러스터의 Klusterlet 에이전트에 문제를 해결해야 하는 오류가 있을 수 있습니다. Klusterlet degraded conditions that are set to True 를 참조하십시오.

1.23.1. 증상: Klusterlet은 성능 저하 상태에 있습니다.
링크 복사

관리 클러스터에 Klusterlet을 배포한 후 KlusterletRegistrationDegraded 또는 KlusterletWorkDegraded 상태가 True 로 표시됩니다.

1.23.2. 문제 식별: Klusterlet은 성능 저하된 상태에 있습니다.
링크 복사

관리 클러스터에서 다음 명령을 실행하여 Klusterlet 상태를 확인합니다.
```
kubectl get klusterlets klusterlet -oyaml
```
KlusterletRegistrationDegraded 또는 KlusterletWorkDegraded 를 선택하여 조건이 True 로 설정되어 있는지 확인합니다. 나열된 모든 성능이 저하된 조건에 대한 문제를 복구합니다.

1.23.3. 문제 해결: Klusterlet은 성능 저하 상태에 있습니다.
링크 복사

다음 성능 저하 상태의 목록과 이러한 문제를 해결하는 방법을 참조하십시오.

상태가 True 이고 조건 이유가 있는 KlusterletRegistrationDegraded 조건이 BootStrapSecretMissing 인 경우 open-cluster-management-agent 네임스페이스에 부트스트랩 시크릿을 생성해야 합니다.
KlusterletRegistrationDegraded 조건이 True 로 표시되고 조건 이유가 BootstrapSecretError 또는 BootstrapSecretUnauthorized 이면 현재 부트스트랩 보안이 유효하지 않습니다. 현재 부트스트랩 시크릿을 삭제하고 open-cluster-management-agent 네임스페이스에 유효한 부트스트랩 시크릿을 다시 생성합니다.
KlusterletRegistrationDegraded 및 KlusterletWorkDegraded 가 True 로 표시되고 조건 이유가 HubKubeConfigSecretMissing 인 경우 Klusterlet을 삭제하고 다시 생성합니다.
KlusterletRegistrationDegraded 및 KlusterletWorkDegraded 가 True 로 표시되고 조건 이유가 ClusterNameMissing,KubeConfig Mising ,HubConfigSecretError, 또는 HubConfigSecretUnauthorized, open-cluster-management-agent 네임스페이스에서 hub cluster kubeconfig 시크릿을 삭제합니다. 등록 에이전트는 다시 부팅되어 새 hub 클러스터 kubeconfig 시크릿을 가져옵니다.
KlusterletRegistrationDegraded 가 True 를 표시하고 조건 이유가 GetRegistrationDeploymentFailed 또는 UnavailableRegistrationPod 인 경우 상태 메시지를 확인하여 문제 세부 정보를 가져오고 해결하려고 할 수 있습니다.
KlusterletWorkDegraded 에 True 가 표시되고 조건 이유가 GetWorkDeploymentFailed , 또는 UnavailableWorkPod 인 경우 조건 메시지를 확인하여 문제 세부 정보를 가져오고 해결하려고 할 수 있습니다.

1.24. 오브젝트 스토리지 채널 시크릿 문제 해결
링크 복사

SecretAccessKey 를 변경하면 Object 스토리지 채널의 구독에서 업데이트된 보안을 자동으로 선택할 수 없으며 오류가 발생합니다.

1.24.1. 증상: 오브젝트 스토리지 채널 시크릿
링크 복사

오브젝트 스토리지 채널의 서브스크립션은 업데이트된 보안을 자동으로 선택할 수 없습니다. 이렇게 하면 서브스크립션 Operator가 오브젝트 스토리지에서 관리 클러스터로 리소스를 조정하지 못하도록 합니다.

1.24.2. 문제 해결: 오브젝트 스토리지 채널 시크릿
링크 복사

시크릿을 생성하기 위해 인증 정보를 수동으로 입력한 다음 채널 내의 시크릿을 참조해야 합니다.

단일 서브스크립션 Operator를 조정하려면 서브스크립션 CR에 주석을 답니다. 다음 데이터 사양을 참조하십시오.

apiVersion: apps.open-cluster-management.io/v1
kind: Channel
metadata:
  name: deva
  namespace: ch-obj
  labels:
    name: obj-sub
spec:
  type: ObjectBucket
  pathname: http://ec2-100-26-232-156.compute-1.amazonaws.com:9000/deva
  sourceNamespaces:
    - default
  secretRef:
    name: dev
---
apiVersion: v1
kind: Secret
metadata:
  name: dev
  namespace: ch-obj
  labels:
    name: obj-sub
data:
  AccessKeyID: YWRtaW4=
  SecretAccessKey: cGFzc3dvcmRhZG1pbg==

oc annotate 를 실행하여 테스트합니다.

oc annotate appsub -n <subscription-namespace> <subscription-name> test=true

명령을 실행한 후 애플리케이션 콘솔로 이동하여 리소스가 관리되는 클러스터에 배포되었는지 확인할 수 있습니다. 또는 관리 클러스터에 로그인하여 애플리케이션 리소스가 지정된 네임스페이스에서 생성되었는지 확인할 수 있습니다.

1.25. 관찰 기능 문제 해결
링크 복사

관찰 기능 구성 요소를 설치하면 구성 요소가 중단되고 설치 상태가 표시됩니다.

1.25.1. 증상: MultiClusterObservability 리소스 상태가 중단됨
링크 복사

설치 후 Observability CRD(사용자 정의 리소스 정의)를 생성한 후 observability 상태가 Installing 상태에 있는 경우 spec:storageConfig:storageClass 매개변수에 대해 정의된 값이 없을 수 있습니다. 또는 관찰 기능 구성 요소에서 기본 storageClass 를 자동으로 찾지만 스토리지 값이 없는 경우 구성 요소는 Installing 상태로 유지됩니다.

1.25.2. 문제 해결: MultiClusterObservability 리소스 상태가 중단됨
링크 복사

이 문제가 있는 경우 다음 단계를 완료합니다.

관찰 기능 구성 요소가 설치되었는지 확인합니다.
1. multicluster-observability-operator 를 확인하려면 다음 명령을 실행합니다.
  kubectl get pods -n open-cluster-management|grep observability
2. 적절한 CRD가 있는지 확인하려면 다음 명령을 실행합니다.
  kubectl get crd|grep observ
  구성 요소를 활성화하기 전에 다음 CRD를 표시해야합니다.
  multiclusterobservabilities.observability.open-cluster-management.io observabilityaddons.observability.open-cluster-management.io observatoria.core.observatorium.io
베어 메탈 클러스터에 대한 자체 storageClass를 생성하는 경우 NFS를 사용하여 영구 스토리지를 참조하십시오.
관찰 기능 구성 요소가 기본 storageClass를 찾을 수 있도록 multicluster-observability-operator 사용자 정의 리소스 정의에서 storageClass 매개변수를 업데이트합니다. 매개변수는 다음 값과 유사할 수 있습니다.

storageclass.kubernetes.io/is-default-class: "true"

설치가 완료되면 관찰 기능 구성 요소 상태가 Ready 상태로 업데이트됩니다. 설치가 실패하면 Fail 상태가 표시됩니다.

1.26. OpenShift 모니터링 서비스 문제 해결
링크 복사

관리 클러스터의 관찰 기능 서비스는 OpenShift Container Platform 모니터링 스택에서 메트릭을 스크랩해야 합니다. OpenShift Container Platform 모니터링 스택이 준비되지 않은 경우 metrics-collector 가 설치되지 않습니다.

1.26.1. 증상: OpenShift 모니터링 서비스가 준비되지 않음
링크 복사

endpoint-observability-operator-x Pod는 openshift-monitoring 네임스페이스에서 prometheus-k8s 서비스를 사용할 수 있는지 확인합니다. 서비스가 openshift-monitoring 네임스페이스에 없으면 metrics-collector 가 배포되지 않습니다. 다음과 같은 오류 메시지가 표시될 수 있습니다. prometheus 리소스를 가져오지 못했습니다.

1.26.2. 문제 해결: OpenShift 모니터링 서비스가 준비되지 않음
링크 복사

이 문제가 있는 경우 다음 단계를 완료합니다.

OpenShift Container Platform 클러스터에 로그인합니다.
openshift-monitoring 네임스페이스에 액세스하여 prometheus-k8s 서비스를 사용할 수 있는지 확인합니다.
관리 클러스터의 open-cluster-management-addon-observability 네임스페이스에서 endpoint-observability-operator-x Pod를 다시 시작합니다.

1.27. metrics-collector 문제 해결
링크 복사

관리 클러스터에서 observability-client-ca-certificate 시크릿이 새로 고쳐지지 않으면 내부 서버 오류가 발생할 수 있습니다.

1.27.1. 증상: metrics-collector에서 observability-client-ca-certificate를 확인할 수 없습니다
링크 복사

메트릭을 사용할 수 없는 관리형 클러스터가 있을 수 있습니다. 이 경우 metrics-collector 배포에서 다음 오류가 발생할 수 있습니다.

error: response status code is 500 Internal Server Error, response body is x509: certificate signed by unknown authority (possibly because of "crypto/rsa: verification error" while trying to verify candidate authority certificate "observability-client-ca-certificate")

1.27.2. 문제 해결: metrics-collector에서 observability-client-ca-certificate를 확인할 수 없습니다
링크 복사

이 문제가 있는 경우 다음 단계를 완료합니다.

관리 클러스터에 로그인합니다.
open-cluster-management-addon-observability 네임스페이스에 있는, observability-controller-open-cluster-management.io-observability-signer-client-cert 라는 시크릿을 삭제합니다. 다음 명령을 실행합니다.
```
oc delete secret observability-controller-open-cluster-management.io-observability-signer-client-cert -n open-cluster-management-addon-observability
```
참고: observability-controller-open-cluster-management.io-observability-signer-client-cert 는 새 인증서로 자동으로 다시 생성됩니다.

metrics-collector 배포가 다시 생성되고 observability-controller-open-cluster-management.io-observability-signer-client-cert 시크릿이 업데이트됩니다.

1.28. PostgreSQL 공유 메모리 오류 문제 해결
링크 복사

대규모 환경이 있는 경우 검색 결과 및 애플리케이션의 토폴로지 보기에 영향을 주는 PostgreSQL 공유 메모리 오류가 발생할 수 있습니다.

1.28.1. 증상: PostgreSQL 공유 메모리 오류
링크 복사

검색-api 로그에 다음과 같은 오류 메시지가 표시됩니다. ERROR: could not resize shared memory segment "/PostgreSQL.1083654800" to 25031264 bytes: No space left on device (SQLSTATE 53100)

1.28.2. 문제 해결: PostgreSQL 공유 메모리 오류
링크 복사

문제를 해결하려면 search-postgres ConfigMap에 있는 PostgreSQL 리소스를 업데이트합니다. 리소스를 업데이트하려면 다음 단계를 완료합니다.

다음 명령을 실행하여 open-cluster-management 프로젝트로 전환합니다.
```
oc project open-cluster-management
```

search-postgres Pod 메모리를 늘립니다. 다음 명령은 메모리를 16Gi 로 늘립니다.

oc patch search -n open-cluster-management search-v2-operator --type json -p '[{"op": "add", "path": "/spec/deployments/database/resources", "value": {"limits": {"memory": "16Gi"}, "requests": {"memory": "32Mi", "cpu": "25m"}}}]'

다음 명령을 실행하여 검색 Operator가 변경 사항을 덮어쓰지 않도록 합니다.
```
oc annotate search search-v2-operator search-pause=true
```

다음 명령을 실행하여 search-postgres YAML 파일에서 리소스를 업데이트합니다.

oc edit cm search-postgres -n open-cluster-management

리소스 증가는 다음 예제를 참조하십시오.

  postgresql.conf: |-
    work_mem = '128MB' # Higher values allocate more memory
    max_parallel_workers_per_gather = '0' # Disables parallel queries
    shared_buffers = '1GB' # Higher values allocate more memory

종료하기 전에 변경 사항을 저장해야 합니다.

다음 명령을 실행하여 postgres 및 api pod를 다시 시작합니다.
```
oc delete pod search-postgres-xyz search-api-xzy
```
변경 사항을 확인하려면 search-postgres YAML 파일을 열고 다음 명령을 실행하여 postgresql.conf: 에 변경한 사항이 있는지 확인합니다.
```
oc get cm search-postgres -n open-cluster-management -o yaml
```

환경 변수 추가에 대한 자세한 내용은 사용자 지정 및 구성 검색을 참조하십시오.

1.29. Thanos compactor halts
링크 복사

compactor가 중지되었다는 오류 메시지가 표시될 수 있습니다. 이 문제는 손상된 블록이 있거나 Thanos compactor PVC(영구 볼륨 클레임)에 공간이 충분하지 않은 경우 발생할 수 있습니다.

1.29.1. 증상: Thanos compactor halts
링크 복사

Thanos compactor는 PVC(영구 볼륨 클레임)에 공간이 없으므로 중지됩니다. 다음 메시지가 표시됩니다.

ts=2024-01-24T15:34:51.948653839Z caller=compact.go:491 level=error msg="critical error detected; halting" err="compaction: group 0@5827190780573537664: compact blocks [ /var/thanos/compact/compact/0@15699422364132557315/01HKZGQGJCKQWF3XMA8EXAMPLE]: 2 errors: populate block: add series: write series data: write /var/thanos/compact/compact/0@15699422364132557315/01HKZGQGJCKQWF3XMA8EXAMPLE.tmp-for-creation/index: no space left on device; write /var/thanos/compact/compact/0@15699422364132557315/01HKZGQGJCKQWF3XMA8EXAMPLE.tmp-for-creation/index: no space left on device"

1.29.2. 문제 해결: Thanos compactor halts
링크 복사

이 문제를 해결하려면 Thanos compactor PVC의 스토리지 공간을 늘리십시오. 다음 단계를 완료합니다.

data-observability-thanos-compact-0 PVC의 스토리지 공간을 늘립니다. 자세한 내용은 영구 볼륨 및 영구 볼륨 클레임 증가 및 감소를 참조하십시오.
Pod를 삭제하여 observability-thanos-compact Pod를 다시 시작합니다. 새 Pod가 자동으로 생성되고 시작됩니다.
```
oc delete pod observability-thanos-compact-0 -n open-cluster-management-observability
```
observability-thanos-compact Pod를 다시 시작한 후 acm_thanos_compact_todo_compactions 메트릭을 확인합니다. Thanos compactor가 백로그를 통해 작동하므로 지표 값이 감소합니다.
지표가 일관된 주기로 변경되었는지 확인하고 디스크 사용량을 확인합니다. 그런 다음 PVC를 다시 줄이기 위해 다시 시도 할 수 있습니다.
참고: 이 작업은 몇 주가 걸릴 수 있습니다.

1.29.3. 증상: Thanos compactor halts
링크 복사

Thanos compactor는 블록이 손상되었기 때문에 중지됩니다. 01HKZYEZ2DVDQXF1STVEXAMPLE 블록이 손상된 다음 출력을 받을 수 있습니다.

ts=2024-01-24T15:34:51.948653839Z caller=compact.go:491 level=error msg="critical error detected; halting" err="compaction: group 0@15699422364132557315: compact blocks [/var/thanos/compact/compact/0@15699422364132557315/01HKZGQGJCKQWF3XMA8EXAMPLE /var/thanos/compact/compact/0@15699422364132557315/01HKZQK7TD06J2XWGR5EXAMPLE /var/thanos/compact/compact/0@15699422364132557315/01HKZYEZ2DVDQXF1STVEXAMPLE /var/thanos/compact/compact/0@15699422364132557315/01HM05APAHXBQSNC0N5EXAMPLE]: populate block: chunk iter: cannot populate chunk 8 from block 01HKZYEZ2DVDQXF1STVEXAMPLE: segment index 0 out of range"

1.29.4. 문제 해결: Thanos compactor halts
링크 복사

오브젝트 스토리지 구성에 thanos bucket verify 명령을 추가합니다. 다음 단계를 완료합니다.

오브젝트 스토리지 구성에 thanos bucket verify 명령을 추가하여 블록 오류를 해결합니다. 다음 명령을 사용하여 observability-thanos-compact Pod에서 구성을 설정합니다.
```
oc rsh observability-thanos-compact-0
[..]
thanos tools bucket verify -r --objstore.config="$OBJSTORE_CONFIG" --objstore-backup.config="$OBJSTORE_CONFIG" --id=01HKZYEZ2DVDQXF1STVEXAMPLE
```
이전 명령이 작동하지 않으면 차단이 손상될 수 있으므로 삭제 블록을 표시해야 합니다. 다음 명령을 실행합니다.
```
thanos tools bucket mark --id "01HKZYEZ2DVDQXF1STVEXAMPLE" --objstore.config="$OBJSTORE_CONFIG" --marker=deletion-mark.json --details=DELETE
```
삭제가 차단된 경우 다음 명령을 실행하여 표시된 블록을 정리합니다.
```
thanos tools bucket cleanup --objstore.config="$OBJSTORE_CONFIG"
```

1.30. 설치 후 Submariner가 연결되지 않음 문제 해결
링크 복사

구성 후 Submariner가 올바르게 실행되지 않으면 다음 단계를 완료하여 문제를 진단합니다.

1.30.1. 증상: 설치 후 하위 시스템이 연결되지 않음
링크 복사

설치 후 하위 네트워크가 통신하지 않습니다.

1.30.2. 문제 식별: 설치 후 Submariner가 연결되지 않음
링크 복사

Submariner 배포 후 네트워크 연결이 설정되지 않은 경우 문제 해결 단계를 시작합니다. Submariner를 배포할 때 프로세스가 완료될 때까지 몇 분이 걸릴 수 있습니다.

1.30.3. 문제 해결: 설치 후 Submariner가 연결되지 않음
링크 복사

배포 후 Submariner가 올바르게 실행되지 않으면 다음 단계를 완료합니다.

Submariner의 구성 요소가 올바르게 배포되었는지 확인하려면 다음 요구 사항을 확인하십시오.
- 하위 mariner-addon 포드는 hub 클러스터의 open-cluster-management 네임스페이스에서 실행되고 있습니다.
- 다음 Pod는 각 관리 클러스터의 submariner-operator 네임스페이스에서 실행됩니다.
  - submariner-addon
  - submariner-gateway
  - submariner-routeagent
  - submariner-operator
  - Submariner-globalnet (ClusterSet에서 Globalnet이 활성화된 경우에만)
  - submariner-lighthouse-agent
  - submariner-lighthouse-coredns
  - Submariner-networkplugin-syncer (지정된 CNI 값이 OVNKubernetes인 경우에만)
  - submariner-metrics-proxy
submariner-addon Pod를 제외하고 subctl diagnose all 명령을 실행하여 필요한 Pod의 상태를 확인합니다.
must-gather 명령을 실행하여 문제 디버깅에 도움이 될 수 있는 로그를 수집하십시오.

1.31. Submariner 엔드 투 엔드 테스트 실패 문제 해결
링크 복사

Submariner 엔드 투 엔드 테스트를 실행한 후 오류가 발생할 수 있습니다. 다음 섹션을 사용하여 이러한 엔드 투 엔드 테스트 실패 문제를 해결하는 데 도움이 됩니다.

1.31.1. 증상: 하위 계층 데이터 플레인 테스트가 실패했습니다.
링크 복사

엔드 투 엔드 데이터 플레인 테스트에 실패하면 Submariner 테스트에서 커넥터 Pod가 리스너 Pod에 연결할 수 있지만 나중에 커넥터 Pod가 수신 대기 단계에서 중단되는 것을 보여줍니다.

1.31.2. 문제 해결: Submariner end-to-end data plane test fails
링크 복사

MTU(최대 전송 단위)는 엔드 투 엔드 데이터 플레인 테스트 실패를 유발할 수 있습니다. 예를 들어 MTU로 인해 IPsec(Internet Protocol Security)을 통한 클러스터 간 트래픽이 실패할 수 있습니다. 작은 패킷 크기를 사용하는 엔드 투 엔드 데이터 플레인 테스트를 실행하여 MTU가 실패했는지 확인합니다.

이 유형의 테스트를 실행하려면 Submariner 작업 영역에서 다음 명령을 실행합니다.

subctl verify --verbose --only connectivity --context <from_context> --tocontext <to_context> --image-override submariner-nettest=quay.io/submariner/nettest:devel --packet-size 200

테스트에 이 작은 패킷 크기로 성공하면 TCP(전송 제어 프로토콜) 최대 세그먼트 크기(MSS)를 설정하여 연결 문제를 해결할 수 있습니다. 다음 단계를 완료하여 TCP MSS를 설정합니다.

게이트웨이 노드에 주석을 달아 TCP MSS 클 amping 값을 설정합니다. 예를 들어 값 1200 을 사용하여 다음 명령을 실행합니다.
```
oc annotate node <node_name> submariner.io/tcp-clamp-mss=1200
```
다음 명령을 실행하여 모든 RouteAgent Pod를 다시 시작합니다.
```
oc delete pod -n submariner-operator -l app=submariner-routeagent
```

1.31.3. 증상: 베어 메탈 클러스터에서 하위 계층 간 테스트가 실패했습니다.
링크 복사

컨테이너 네트워크 인터페이스(CNI)가 OpenShiftSDN인 경우 엔드 투 엔드 데이터 플레인 테스트가 없거나 클러스터 간 터널에 가상 확장 가능한 로컬 영역 네트워크(VXLAN)가 사용되는 경우 베어 메탈 클러스터에 실패할 수 있습니다.

1.31.4. 문제 해결: 베어 메탈 클러스터에서 하위 계층 간 테스트가 실패했습니다.
링크 복사

하드웨어에서 UDP(User Datagram Protocal) 체크섬 계산의 버그는 베어 메탈 클러스터의 엔드 투 엔드 데이터 플레인 테스트 실패의 근본 원인이 될 수 있습니다. 이 버그 문제를 해결하려면 다음 YAML 파일을 적용하여 하드웨어 오프로드를 비활성화합니다.

apiVersion: apps/v1
kind: DaemonSet
metadata:
  name: disable-offload
  namespace: submariner-operator
spec:
  selector:
    matchLabels:
      app: disable-offload
  template:
    metadata:
      labels:
        app: disable-offload
    spec:
      tolerations:
      - operator: Exists
      containers:
        - name: disable-offload
          image: nicolaka/netshoot
          imagePullPolicy: IfNotPresent
          securityContext:
            allowPrivilegeEscalation: true
            capabilities:
              add:
              - net_admin
              drop:
              - all
            privileged: true
            readOnlyRootFilesystem: false
            runAsNonRoot: false
          command: ["/bin/sh", "-c"]
          args:
            - ethtool --offload vxlan-tunnel rx off tx off;
              ethtool --offload vx-submariner rx off tx off;
sleep infinity
      restartPolicy: Always
      securityContext: {}
      serviceAccount: submariner-routeagent
      serviceAccountName: submariner-routeagent
      hostNetwork: true

1.32. 복원 상태 문제 해결 오류와 함께 완료
링크 복사

백업을 복원하면 리소스가 올바르게 복원되지만 Red Hat Advanced Cluster Management 복원 리소스에 FinishedWithErrors 상태가 표시됩니다.

1.32.1. 증상: 복원 상태 문제 해결이 오류로 완료됨
링크 복사

Red Hat Advanced Cluster Management에는 FinishedWithErrors 상태가 표시되고 Red Hat Advanced Cluster Management 복원에서 생성한 하나 이상의 Velero 복원 리소스에는 PartiallyFailed 상태가 표시됩니다.

1.32.2. 문제 해결: 복원 상태 문제 해결이 오류와 함께 완료
링크 복사

비어 있는 백업에서 복원하는 경우 FinishedWithErrors 상태를 무시해도 됩니다.

Kubernetes 복원용 Red Hat Advanced Cluster Management에는 모든 Velero 복원 리소스의 누적 상태가 표시됩니다. 하나의 상태가 PartiallyFailed 이고 다른 하나는 Completed 인 경우 표시되는 누적 상태는 하나 이상의 문제가 있음을 알리는 PartiallyFailed 입니다.

이 문제를 해결하려면 PartiallyFailed 상태로 모든 개별 Velero 복원 리소스의 상태를 확인하고 자세한 내용은 로그를 확인합니다. 오브젝트 스토리지에서 직접 로그를 가져오거나 DownloadRequest 사용자 정의 리소스를 사용하여 OADP Operator에서 로그를 다운로드할 수 있습니다.

콘솔에서 DownloadRequest 를 생성하려면 다음 단계를 완료합니다.

Operators > Installed Operators > Create DownloadRequest 로 이동합니다.
BackupLog 를 종류로 선택하고 콘솔 지침에 따라 DownloadRequest 생성을 완료합니다.

1.33. 여러 줄 YAML 구문 분석 문제 해결
링크 복사

fromSecret 함수를 사용하여 Secret 리소스의 콘텐츠를 Route 리소스에 추가하려는 경우 콘텐츠가 잘못 표시됩니다.

1.33.1. 증상: 여러 줄 YAML 구문 분석 문제 해결
링크 복사

관리 클러스터 및 허브 클러스터가 동일한 클러스터인 경우 인증서 데이터가 수정되므로 내용이 템플릿 JSON 문자열로 구문 분석되지 않습니다. 다음과 같은 오류 메시지가 표시될 수 있습니다.

message: >-
            [spec.tls.caCertificate: Invalid value: "redacted ca certificate
            data": failed to parse CA certificate: data does not contain any
            valid RSA or ECDSA certificates, spec.tls.certificate: Invalid
            value: "redacted certificate data": data does not contain any valid
            RSA or ECDSA certificates, spec.tls.key: Invalid value: "": no key specified]

1.33.2. 문제 해결: 여러 줄 YAML 구문 분석 문제 해결
링크 복사

hub 클러스터 및 관리 클러스터 fromSecret 값을 검색하도록 인증서 정책을 구성합니다. autoindent 함수를 사용하여 다음 콘텐츠로 인증서 정책을 업데이트합니다.

                 tls:
                    certificate: |
                      {{ print "{{hub fromSecret "open-cluster-management" "minio-cert" "tls.crt" hub}}" | base64dec | autoindent }}

1.34. ClusterCurator 자동 템플릿 배포 실패 문제 해결
링크 복사

ClusterCurator 자동 템플릿을 사용하고 배포하지 못하는 경우 절차에 따라 문제를 해결합니다.

1.34.1. 증상: ClusterCurator 자동 템플릿 배포 실패
링크 복사

ClusterCurator 자동 템플릿을 사용하여 관리 클러스터를 배포할 수 없습니다. 프로세스는 posthooks에 중단되어 로그를 생성하지 못할 수 있습니다.

1.34.2. 문제 해결: ClusterCurator 자동 템플릿 배포 실패
링크 복사

문제를 식별하고 해결하려면 다음 단계를 완료합니다.

메시지 또는 오류가 있는지 클러스터 네임스페이스의 ClusterCurator 리소스 상태를 확인합니다.
이전 단계와 동일한 클러스터 네임스페이스에 있는 curator-job-* 라는 작업 리소스에서 Pod 로그에 오류가 있는지 확인합니다.

참고: 라이브(TTL) 설정으로 인해 작업이 1시간 후에 제거됩니다.

법적 공지
링크 복사

The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.

Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.

Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.

Linux® is the registered trademark of Linus Torvalds in the United States and other countries.

Java® is a registered trademark of Oracle and/or its affiliates.

XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.

MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.

Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.

The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.

All other trademarks are the property of their respective owners.

문제 해결

Red Hat Advanced Cluster Management의 문제 해결 정보를 확인하십시오.

1장. 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.1. 문서화된 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.2. must-gather 명령을 실행하여 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.2.1. must-gather 시나리오링크 복사링크가 클립보드에 복사되었습니다!

1.2.2. must-gather 절차링크 복사링크가 클립보드에 복사되었습니다!

1.2.3. 연결이 끊긴 환경의 must-gather링크 복사링크가 클립보드에 복사되었습니다!

1.2.4. 호스트 클러스터의 must-gather링크 복사링크가 클립보드에 복사되었습니다!

1.2.4.1. 호스팅된 클러스터의 must-gather 명령 정보링크 복사링크가 클립보드에 복사되었습니다!

1.2.4.2. 사전 요구 사항링크 복사링크가 클립보드에 복사되었습니다!

1.2.4.3. 호스트된 클러스터에 대한 must-gather 명령 입력링크 복사링크가 클립보드에 복사되었습니다!

1.2.4.4. 연결이 끊긴 환경에서 must-gather 명령 입력링크 복사링크가 클립보드에 복사되었습니다!

1.2.4.5. 추가 리소스링크 복사링크가 클립보드에 복사되었습니다!

1.3. 설치 또는 보류 중인 설치 상태 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.3.1. 증상: 보류 중 상태 발생링크 복사링크가 클립보드에 복사되었습니다!

1.3.2. 문제 해결: 작업자 노드 크기 조정링크 복사링크가 클립보드에 복사되었습니다!

1.4. Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.4.1. 증상: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.4.2. 문제 해결: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.4.2.1. 검증링크 복사링크가 클립보드에 복사되었습니다!

1.5. 오프라인 클러스터 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.5.1. 증상: 클러스터 상태가 오프라인 상태링크 복사링크가 클립보드에 복사되었습니다!

1.5.2. 문제 해결: 클러스터 상태가 오프라인 상태입니다.링크 복사링크가 클립보드에 복사되었습니다!

1.6. 관리형 클러스터 가져오기 실패 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.6.1. 증상: 가져온 클러스터를 사용할 수 없음링크 복사링크가 클립보드에 복사되었습니다!

1.6.2. 문제 해결: 가져온 클러스터를 사용할 수 없음링크 복사링크가 클립보드에 복사되었습니다!

1.7. 가져오기 보류 중 상태의 클러스터 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.7.1. 증상: 가져오기 상태가 보류 중인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.7.2. 문제 확인: 가져오기 보류 중인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.7.3. 문제 해결: 가져오기 보류 중인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.8. 이미 존재하는 클러스터 문제 해결 오류링크 복사링크가 클립보드에 복사되었습니다!

1.8.1. 증상: OpenShift Container Platform 클러스터를 가져올 때 오류 로그가 준비됨링크 복사링크가 클립보드에 복사되었습니다!

1.8.2. 문제 확인: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.8.3. 문제 해결: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9. VMware vSphere에서 클러스터 생성 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.9.1. 인증서 IP SAN 오류와 함께 관리되는 클러스터 생성 실패링크 복사링크가 클립보드에 복사되었습니다!

1.9.1.1. 증상: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.1.2. 문제 식별: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.1.3. 문제 해결: 인증서 IP SAN 오류로 관리되는 클러스터 생성에 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.2. 알 수 없는 인증 기관으로 관리 클러스터 생성 실패링크 복사링크가 클립보드에 복사되었습니다!

1.9.2.1. 증상: 관리형 클러스터 생성이 알 수 없는 인증 기관으로 인해 실패함링크 복사링크가 클립보드에 복사되었습니다!

1.9.2.2. 문제 식별: Managed cluster creation fails with unknown certificate authority링크 복사링크가 클립보드에 복사되었습니다!

1.9.2.3. 문제 해결: 알 수 없는 인증 기관을 사용하면 관리형 클러스터 생성이 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.3. 만료된 인증서로 관리되는 클러스터 생성 실패링크 복사링크가 클립보드에 복사되었습니다!

1.9.3.1. 증상: 만료된 인증서로 관리 클러스터 생성에 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.3.2. 문제 식별: 만료된 인증서로 관리 클러스터 생성이 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.3.3. 문제 해결: 만료된 인증서로 관리 클러스터 생성이 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.4. 관리 클러스터 생성에 실패하여 태그 지정 권한이 충분하지 않음링크 복사링크가 클립보드에 복사되었습니다!

1.9.4.1. 증상: 관리형 클러스터 생성이 실패하고 태그 지정 권한이 충분하지 않음링크 복사링크가 클립보드에 복사되었습니다!

1.9.4.2. 문제 식별: 관리형 클러스터 생성이 실패하여 태그 지정 권한이 부족하지 않습니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.4.3. 문제 해결: 태그 지정에 대한 권한이 부족하여 관리되는 클러스터 생성이 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.5. 관리 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.5.1. 증상: 관리형 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.5.2. 문제 식별: Managed 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.5.3. 문제 해결: 잘못된 dnsVIP와 함께 관리 클러스터 생성이 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.6. 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.6.1. 증상: 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.6.2. 문제 식별: Managed cluster creation fails with incorrect network type링크 복사링크가 클립보드에 복사되었습니다!

1.9.6.3. 문제 해결: 관리형 클러스터 생성이 잘못된 네트워크 유형으로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.9.7. 디스크 처리 디스크 변경 오류와 함께 관리되는 클러스터 생성 실패링크 복사링크가 클립보드에 복사되었습니다!

1.9.7.1. 증상: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터 추가 실패링크 복사링크가 클립보드에 복사되었습니다!

1.9.7.2. 문제 식별: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다링크 복사링크가 클립보드에 복사되었습니다!

1.9.7.3. 문제 해결: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다링크 복사링크가 클립보드에 복사되었습니다!

1.10. 알 수 없는 권한 오류로 Red Hat OpenStack Platform에서 관리형 클러스터 생성 문제 해결 실패링크 복사링크가 클립보드에 복사되었습니다!

1.10.1. 증상: 관리형 클러스터 생성에 알 수 없는 권한 오류로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.10.2. 문제 식별: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.10.3. 문제 해결: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.링크 복사링크가 클립보드에 복사되었습니다!

1.11. 인증서 변경 후 가져온 클러스터 오프라인 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.11.1. 증상: 인증서 변경 후 오프라인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.11.2. 문제 식별: 인증서 변경 후 오프라인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.11.3. 문제 해결: 인증서 변경 후 오프라인 클러스터링크 복사링크가 클립보드에 복사되었습니다!

1.12. 클러스터를 삭제한 후에도 네임스페이스가 남아 있음링크 복사링크가 클립보드에 복사되었습니다!

1.12.1. 증상: 클러스터를 삭제한 후에도 네임스페이스가 유지됩니다.링크 복사링크가 클립보드에 복사되었습니다!

1.12.2. 문제 해결: 클러스터를 삭제한 후에도 네임스페이스가 남아 있습니다.링크 복사링크가 클립보드에 복사되었습니다!

1.13. 클러스터를 가져올 때 auto-import-secret-exists 오류링크 복사링크가 클립보드에 복사되었습니다!

1.13.1. 증상: 클러스터를 가져올 때 자동 가져오기 보안 오류가 발생했습니다링크 복사링크가 클립보드에 복사되었습니다!

1.13.2. 문제 해결: 클러스터를 가져올 때 Auto-import-secret-exists 오류링크 복사링크가 클립보드에 복사되었습니다!

1.14. volSync용 CSI(Container Storage Interface) 드라이버 문제 해결링크 복사링크가 클립보드에 복사되었습니다!

1.14.1. 증상: Volumesnapshot 오류 상태링크 복사링크가 클립보드에 복사되었습니다!

1장. 문제 해결
링크 복사

1.1. 문서화된 문제 해결
링크 복사

1.2. must-gather 명령을 실행하여 문제 해결
링크 복사

1.2.1. must-gather 시나리오
링크 복사

1.2.2. must-gather 절차
링크 복사

1.2.3. 연결이 끊긴 환경의 must-gather
링크 복사

1.2.4. 호스트 클러스터의 must-gather
링크 복사

1.2.4.1. 호스팅된 클러스터의 must-gather 명령 정보
링크 복사

1.2.4.2. 사전 요구 사항
링크 복사

1.2.4.3. 호스트된 클러스터에 대한 must-gather 명령 입력
링크 복사

1.2.4.4. 연결이 끊긴 환경에서 must-gather 명령 입력
링크 복사

1.2.4.5. 추가 리소스
링크 복사

1.3. 설치 또는 보류 중인 설치 상태 문제 해결
링크 복사

1.3.1. 증상: 보류 중 상태 발생
링크 복사

1.3.2. 문제 해결: 작업자 노드 크기 조정
링크 복사

1.4. Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

1.4.1. 증상: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

1.4.2. 문제 해결: Red Hat Advanced Cluster Management 업그레이드 후 ocm-controller 오류 문제 해결
링크 복사

1.4.2.1. 검증
링크 복사

1.5. 오프라인 클러스터 문제 해결
링크 복사

1.5.1. 증상: 클러스터 상태가 오프라인 상태
링크 복사

1.5.2. 문제 해결: 클러스터 상태가 오프라인 상태입니다.
링크 복사

1.6. 관리형 클러스터 가져오기 실패 문제 해결
링크 복사

1.6.1. 증상: 가져온 클러스터를 사용할 수 없음
링크 복사

1.6.2. 문제 해결: 가져온 클러스터를 사용할 수 없음
링크 복사

1.7. 가져오기 보류 중 상태의 클러스터 문제 해결
링크 복사

1.7.1. 증상: 가져오기 상태가 보류 중인 클러스터
링크 복사

1.7.2. 문제 확인: 가져오기 보류 중인 클러스터
링크 복사

1.7.3. 문제 해결: 가져오기 보류 중인 클러스터
링크 복사

1.8. 이미 존재하는 클러스터 문제 해결 오류
링크 복사

1.8.1. 증상: OpenShift Container Platform 클러스터를 가져올 때 오류 로그가 준비됨
링크 복사

1.8.2. 문제 확인: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.
링크 복사

1.8.3. 문제 해결: OpenShift Container Platform 클러스터를 가져올 때 이미 존재합니다.
링크 복사

1.9. VMware vSphere에서 클러스터 생성 문제 해결
링크 복사

1.9.1. 인증서 IP SAN 오류와 함께 관리되는 클러스터 생성 실패
링크 복사

1.9.1.1. 증상: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.
링크 복사

1.9.1.2. 문제 식별: 관리형 클러스터 생성이 인증서 IP SAN 오류로 인해 실패합니다.
링크 복사

1.9.1.3. 문제 해결: 인증서 IP SAN 오류로 관리되는 클러스터 생성에 실패합니다.
링크 복사

1.9.2. 알 수 없는 인증 기관으로 관리 클러스터 생성 실패
링크 복사

1.9.2.1. 증상: 관리형 클러스터 생성이 알 수 없는 인증 기관으로 인해 실패함
링크 복사

1.9.2.2. 문제 식별: Managed cluster creation fails with unknown certificate authority
링크 복사

1.9.2.3. 문제 해결: 알 수 없는 인증 기관을 사용하면 관리형 클러스터 생성이 실패합니다.
링크 복사

1.9.3. 만료된 인증서로 관리되는 클러스터 생성 실패
링크 복사

1.9.3.1. 증상: 만료된 인증서로 관리 클러스터 생성에 실패합니다.
링크 복사

1.9.3.2. 문제 식별: 만료된 인증서로 관리 클러스터 생성이 실패합니다.
링크 복사

1.9.3.3. 문제 해결: 만료된 인증서로 관리 클러스터 생성이 실패합니다.
링크 복사

1.9.4. 관리 클러스터 생성에 실패하여 태그 지정 권한이 충분하지 않음
링크 복사

1.9.4.1. 증상: 관리형 클러스터 생성이 실패하고 태그 지정 권한이 충분하지 않음
링크 복사

1.9.4.2. 문제 식별: 관리형 클러스터 생성이 실패하여 태그 지정 권한이 부족하지 않습니다.
링크 복사

1.9.4.3. 문제 해결: 태그 지정에 대한 권한이 부족하여 관리되는 클러스터 생성이 실패합니다.
링크 복사

1.9.5. 관리 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

1.9.5.1. 증상: 관리형 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

1.9.5.2. 문제 식별: Managed 클러스터 생성이 유효하지 않은 dnsVIP와 함께 실패합니다.
링크 복사

1.9.5.3. 문제 해결: 잘못된 dnsVIP와 함께 관리 클러스터 생성이 실패합니다.
링크 복사

1.9.6. 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.
링크 복사

1.9.6.1. 증상: 관리형 클러스터 생성이 잘못된 네트워크 유형과 함께 실패합니다.
링크 복사

1.9.6.2. 문제 식별: Managed cluster creation fails with incorrect network type
링크 복사

1.9.6.3. 문제 해결: 관리형 클러스터 생성이 잘못된 네트워크 유형으로 인해 실패합니다.
링크 복사

1.9.7. 디스크 처리 디스크 변경 오류와 함께 관리되는 클러스터 생성 실패
링크 복사

1.9.7.1. 증상: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터 추가 실패
링크 복사

1.9.7.2. 문제 식별: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다
링크 복사

1.9.7.3. 문제 해결: 오류 처리 디스크 변경으로 인해 VMware vSphere 관리 클러스터를 추가할 수 없습니다
링크 복사

1.10. 알 수 없는 권한 오류로 Red Hat OpenStack Platform에서 관리형 클러스터 생성 문제 해결 실패
링크 복사

1.10.1. 증상: 관리형 클러스터 생성에 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

1.10.2. 문제 식별: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

1.10.3. 문제 해결: 관리 클러스터 생성이 알 수 없는 권한 오류로 인해 실패합니다.
링크 복사

1.11. 인증서 변경 후 가져온 클러스터 오프라인 문제 해결
링크 복사

1.11.1. 증상: 인증서 변경 후 오프라인 클러스터
링크 복사

1.11.2. 문제 식별: 인증서 변경 후 오프라인 클러스터
링크 복사

1.11.3. 문제 해결: 인증서 변경 후 오프라인 클러스터
링크 복사

1.12. 클러스터를 삭제한 후에도 네임스페이스가 남아 있음
링크 복사

1.12.1. 증상: 클러스터를 삭제한 후에도 네임스페이스가 유지됩니다.
링크 복사

1.12.2. 문제 해결: 클러스터를 삭제한 후에도 네임스페이스가 남아 있습니다.
링크 복사

1.13. 클러스터를 가져올 때 auto-import-secret-exists 오류
링크 복사

1.13.1. 증상: 클러스터를 가져올 때 자동 가져오기 보안 오류가 발생했습니다
링크 복사

1.13.2. 문제 해결: 클러스터를 가져올 때 Auto-import-secret-exists 오류
링크 복사

1.14. volSync용 CSI(Container Storage Interface) 드라이버 문제 해결
링크 복사

1.14.1. 증상: Volumesnapshot 오류 상태
링크 복사

1.14.2. 문제 해결: 매개변수를 true로 설정
링크 복사

1.15. must-gather 명령 문제 해결
링크 복사