4.9. Operator 문제 해결

4.9.1. Operator 서브스크립션 상태 유형
링크 복사

서브스크립션은 다음 상태 유형을 보고할 수 있습니다.

Expand

표 4.2. 서브스크립션 상태 유형
상태	설명
`CatalogSourcesUnhealthy`	해결에 사용되는 일부 또는 모든 카탈로그 소스가 정상 상태가 아닙니다.
`InstallPlanMissing`	서브스크립션 설치 계획이 없습니다.
`InstallPlanPending`	서브스크립션 설치 계획이 설치 대기 중입니다.
`InstallPlanFailed`	서브스크립션 설치 계획이 실패했습니다.
`ResolutionFailed`	서브스크립션의 종속성 확인에 실패했습니다.

참고

AWS 클러스터 Operator의 기본 Red Hat OpenShift Service는 CVO(Cluster Version Operator)에 의해 관리되며 Subscription 오브젝트가 없습니다. 애플리케이션 Operator는 OLM(Operator Lifecycle Manager)에서 관리하며 Subscription 오브젝트가 있습니다.

4.9.2. CLI를 사용하여 Operator 서브스크립션 상태 보기
링크 복사

CLI를 사용하여 Operator 서브스크립션 상태를 볼 수 있습니다.

사전 요구 사항

dedicated-admin 역할의 사용자로 클러스터에 액세스할 수 있습니다.
OpenShift CLI(oc)가 설치되어 있습니다.

프로세스

Operator 서브스크립션을 나열합니다.
```
$ oc get subs -n <operator_namespace>
```
oc describe 명령을 사용하여 Subscription 리소스를 검사합니다.
```
$ oc describe sub <subscription_name> -n <operator_namespace>
```

명령 출력에서 Operator 서브스크립션 조건 유형의 상태에 대한 Conditions 섹션을 확인합니다. 다음 예에서 사용 가능한 모든 카탈로그 소스가 정상이므로 CatalogSourcesUnhealthy 조건 유형의 상태가 false입니다.

출력 예

Name:         cluster-logging
Namespace:    openshift-logging
Labels:       operators.coreos.com/cluster-logging.openshift-logging=
Annotations:  <none>
API Version:  operators.coreos.com/v1alpha1
Kind:         Subscription
# ...
Conditions:
   Last Transition Time:  2019-07-29T13:42:57Z
   Message:               all available catalogsources are healthy
   Reason:                AllCatalogSourcesHealthy
   Status:                False
   Type:                  CatalogSourcesUnhealthy
# ...

참고

AWS 클러스터 Operator의 기본 Red Hat OpenShift Service는 CVO(Cluster Version Operator)에 의해 관리되며 Subscription 오브젝트가 없습니다. 애플리케이션 Operator는 OLM(Operator Lifecycle Manager)에서 관리하며 Subscription 오브젝트가 있습니다.

4.9.3. CLI를 사용하여 Operator 카탈로그 소스 상태 보기
링크 복사

CLI를 사용하여 Operator 카탈로그 소스의 상태를 볼 수 있습니다.

사전 요구 사항

dedicated-admin 역할의 사용자로 클러스터에 액세스할 수 있습니다.
OpenShift CLI(oc)가 설치되어 있습니다.

프로세스

네임스페이스의 카탈로그 소스를 나열합니다. 예를 들어 클러스터 전체 카탈로그 소스에 사용되는 openshift-marketplace 네임스페이스를 확인할 수 있습니다.

$ oc get catalogsources -n openshift-marketplace

출력 예

NAME                  DISPLAY               TYPE   PUBLISHER   AGE
certified-operators   Certified Operators   grpc   Red Hat     55m
community-operators   Community Operators   grpc   Red Hat     55m
example-catalog       Example Catalog       grpc   Example Org 2m25s
redhat-marketplace    Red Hat Marketplace   grpc   Red Hat     55m
redhat-operators      Red Hat Operators     grpc   Red Hat     55m

oc describe 명령을 사용하여 카탈로그 소스에 대한 자세한 내용 및 상태를 가져옵니다.

$ oc describe catalogsource example-catalog -n openshift-marketplace

출력 예

Name:         example-catalog
Namespace:    openshift-marketplace
Labels:       <none>
Annotations:  operatorframework.io/managed-by: marketplace-operator
              target.workload.openshift.io/management: {"effect": "PreferredDuringScheduling"}
API Version:  operators.coreos.com/v1alpha1
Kind:         CatalogSource
# ...
Status:
  Connection State:
    Address:              example-catalog.openshift-marketplace.svc:50051
    Last Connect:         2021-09-09T17:07:35Z
    Last Observed State:  TRANSIENT_FAILURE
  Registry Service:
    Created At:         2021-09-09T17:05:45Z
    Port:               50051
    Protocol:           grpc
    Service Name:       example-catalog
    Service Namespace:  openshift-marketplace
# ...

앞의 예제 출력에서 마지막으로 관찰된 상태는 TRANSIENT_FAILURE입니다. 이 상태는 카탈로그 소스에 대한 연결을 설정하는 데 문제가 있음을 나타냅니다.

카탈로그 소스가 생성된 네임스페이스의 Pod를 나열합니다.

$ oc get pods -n openshift-marketplace

출력 예

NAME                                    READY   STATUS             RESTARTS   AGE
certified-operators-cv9nn               1/1     Running            0          36m
community-operators-6v8lp               1/1     Running            0          36m
marketplace-operator-86bfc75f9b-jkgbc   1/1     Running            0          42m
example-catalog-bwt8z                   0/1     ImagePullBackOff   0          3m55s
redhat-marketplace-57p8c                1/1     Running            0          36m
redhat-operators-smxx8                  1/1     Running            0          36m

카탈로그 소스가 네임스페이스에 생성되면 해당 네임스페이스에 카탈로그 소스의 Pod가 생성됩니다. 위 예제 출력에서 example-catalog-bwt8z pod의 상태는 ImagePullBackOff입니다. 이 상태는 카탈로그 소스의 인덱스 이미지를 가져오는 데 문제가 있음을 나타냅니다.

자세한 정보는 oc describe 명령을 사용하여 Pod를 검사합니다.

$ oc describe pod example-catalog-bwt8z -n openshift-marketplace

출력 예

Name:         example-catalog-bwt8z
Namespace:    openshift-marketplace
Priority:     0
Node:         ci-ln-jyryyg2-f76d1-ggdbq-worker-b-vsxjd/10.0.128.2
...
Events:
  Type     Reason          Age                From               Message
  ----     ------          ----               ----               -------
  Normal   Scheduled       48s                default-scheduler  Successfully assigned openshift-marketplace/example-catalog-bwt8z to ci-ln-jyryyf2-f76d1-fgdbq-worker-b-vsxjd
  Normal   AddedInterface  47s                multus             Add eth0 [10.131.0.40/23] from openshift-sdn
  Normal   BackOff         20s (x2 over 46s)  kubelet            Back-off pulling image "quay.io/example-org/example-catalog:v1"
  Warning  Failed          20s (x2 over 46s)  kubelet            Error: ImagePullBackOff
  Normal   Pulling         8s (x3 over 47s)   kubelet            Pulling image "quay.io/example-org/example-catalog:v1"
  Warning  Failed          8s (x3 over 47s)   kubelet            Failed to pull image "quay.io/example-org/example-catalog:v1": rpc error: code = Unknown desc = reading manifest v1 in quay.io/example-org/example-catalog: unauthorized: access to the requested resource is not authorized
  Warning  Failed          8s (x3 over 47s)   kubelet            Error: ErrImagePull

앞의 예제 출력에서 오류 메시지는 권한 부여 문제로 인해 카탈로그 소스의 인덱스 이미지를 성공적으로 가져오지 못한 것으로 표시됩니다. 예를 들어 인덱스 이미지는 로그인 인증 정보가 필요한 레지스트리에 저장할 수 있습니다.

4.9.4. Operator Pod 상태 쿼리
링크 복사

클러스터 내의 Operator Pod 및 해당 상태를 나열할 수 있습니다. 자세한 Operator Pod 요약을 수집할 수도 있습니다.

사전 요구 사항

dedicated-admin 역할의 사용자로 클러스터에 액세스할 수 있습니다.
API 서비스가 작동하고 있어야 합니다.
OpenShift CLI(oc)가 설치되어 있습니다.

프로세스

클러스터에서 실행중인 Operator를 나열합니다. 출력에는 Operator 버전, 가용성 및 가동 시간 정보가 포함됩니다.
```
$ oc get clusteroperators
```
Operator의 네임스페이스에서 실행 중인 Operator Pod와 Pod 상태, 재시작, 경과 시간을 표시합니다.
```
$ oc get pod -n <operator_namespace>
```

자세한 Operator Pod 요약을 출력합니다.

$ oc describe pod <operator_pod_name> -n <operator_namespace>

4.9.5. Operator 로그 수집
링크 복사

Operator 문제가 발생하면 Operator Pod 로그에서 자세한 진단 정보를 수집할 수 있습니다.

사전 요구 사항

dedicated-admin 역할의 사용자로 클러스터에 액세스할 수 있습니다.
API 서비스가 작동하고 있어야 합니다.
OpenShift CLI(oc)가 설치되어 있습니다.
컨트롤 플레인 또는 컨트롤 플레인 시스템의 정규화된 도메인 이름이 있어야 합니다.

프로세스

Operator의 네임스페이스에서 실행 중인 Operator Pod와 Pod 상태, 재시작, 경과 시간을 표시합니다.
```
$ oc get pods -n <operator_namespace>
```
Operator Pod의 로그를 검토합니다.
```
$ oc logs pod/<pod_name> -n <operator_namespace>
```
Operator Pod에 컨테이너가 여러 개 있는 경우 위 명령에 의해 각 컨테이너의 이름이 포함된 오류가 생성됩니다. 개별 컨테이너의 로그를 쿼리합니다.
```
$ oc logs pod/<operator_pod_name> -c <container_name> -n <operator_namespace>
```
API가 작동하지 않는 경우 대신 SSH를 사용하여 각 컨트롤 플레인 노드에서 Operator Pod 및 컨테이너 로그를 검토합니다. <master-node>.<cluster_name>.<base_domain>을 적절한 값으로 바꿉니다.
1. 각 컨트롤 플레인 노드에 Pod를 나열합니다.
  $ ssh core@<master-node>.<cluster_name>.<base_domain> sudo crictl pods
2. Ready 상태가 표시되지 않는 Operator Pod의 경우 Pod 상태를 자세히 검사합니다. <operator_pod_id>를 이전 명령의 출력에 나열된 Operator Pod의 ID로 교체합니다.
  $ ssh core@<master-node>.<cluster_name>.<base_domain> sudo crictl inspectp <operator_pod_id>
3. Operator Pod와 관련된 컨테이너를 나열합니다.
  $ ssh core@<master-node>.<cluster_name>.<base_domain> sudo crictl ps --pod=<operator_pod_id>
4. Ready 상태가 표시되지 않는 Operator 컨테이너의 경우 컨테이너 상태를 자세히 검사합니다. <container_id>를 이전 명령의 출력에 나열된 컨테이너 ID로 바꿉니다.
  $ ssh core@<master-node>.<cluster_name>.<base_domain> sudo crictl inspect <container_id>
5. Ready 상태가 표시되지 않는 Operator 컨테이너의 로그를 확인합니다. <container_id>를 이전 명령의 출력에 나열된 컨테이너 ID로 바꿉니다.
  $ ssh core@<master-node>.<cluster_name>.<base_domain> sudo crictl logs -f <container_id>
  참고
  RHCOS(Red Hat Enterprise Linux CoreOS)를 실행하는 AWS 4 클러스터 노드의 Red Hat OpenShift Service는 변경할 수 없으며 Operator를 통해 클러스터 변경 사항을 적용합니다. SSH를 사용하여 클러스터 노드에 액세스하는 것은 권장되지 않습니다. SSH를 통해 진단 데이터를 수집하기 전에 oc adm must gather 및 기타 oc 명령을 실행하여 충분한 데이터를 수집할 수 있는지 확인하십시오. 그러나 AWS API의 Red Hat OpenShift Service를 사용할 수 없거나 kubelet이 대상 노드에서 제대로 작동하지 않는 경우 oc 작업이 영향을 받습니다. 이러한 상황에서 ssh core@<node>.<cluster_name>.<base_domain>을 사용하여 노드에 액세스할 수 있습니다.

4.9.1. Operator 서브스크립션 상태 유형
링크 복사

4.9.2. CLI를 사용하여 Operator 서브스크립션 상태 보기
링크 복사

4.9.3. CLI를 사용하여 Operator 카탈로그 소스 상태 보기
링크 복사

4.9.4. Operator Pod 상태 쿼리
링크 복사

4.9.5. Operator 로그 수집
링크 복사

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 소개

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 문서 정보

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

4.9. Operator 문제 해결

4.9.1. Operator 서브스크립션 상태 유형링크 복사링크가 클립보드에 복사되었습니다!

4.9.2. CLI를 사용하여 Operator 서브스크립션 상태 보기링크 복사링크가 클립보드에 복사되었습니다!

4.9.3. CLI를 사용하여 Operator 카탈로그 소스 상태 보기링크 복사링크가 클립보드에 복사되었습니다!

4.9.4. Operator Pod 상태 쿼리링크 복사링크가 클립보드에 복사되었습니다!

4.9.5. Operator 로그 수집링크 복사링크가 클립보드에 복사되었습니다!

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 소개

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 문서 정보

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

4.9.1. Operator 서브스크립션 상태 유형
링크 복사

4.9.2. CLI를 사용하여 Operator 서브스크립션 상태 보기
링크 복사

4.9.3. CLI를 사용하여 Operator 카탈로그 소스 상태 보기
링크 복사

4.9.4. Operator Pod 상태 쿼리
링크 복사

4.9.5. Operator 로그 수집
링크 복사