7장. OpenShift Data Foundation의 경고 및 오류 문제 해결

7.1. 경고 및 오류 해결
링크 복사

Red Hat OpenShift Data Foundation은 여러 일반적인 오류 시나리오를 감지하고 자동으로 해결할 수 있습니다. 그러나 일부 문제는 관리자의 개입이 필요합니다.

현재 실행 중인 오류를 알아보려면 다음 위치 중 하나를 확인합니다.

모니터링 경고 → 실행 옵션
홈 개요 클러스터 탭
팝업 창에 있는 스토리지 데이터 기반 스토리지 시스템 스토리지 시스템 링크 개요 블록 및 파일 탭
팝업 개요 → 오브젝트 탭의 스토리지 스토리지 시스템 스토리지 시스템 스토리지 시스템 링크

표시된 오류를 복사하고 다음 섹션에서 검색하여 심각도 및 해상도를 확인합니다.

Expand

Name: CephMonVersionMismatch

Message:여러 버전의 스토리지 서비스가 실행되고 있습니다.

설명:{{ $value }} 버전의 Ceph Mon 구성 요소가 실행 중입니다.

심각도: 경고

해결 방법 : 수정

프로시저: 사용자 인터페이스를 검사하고 기록한 후 업데이트가 진행 중인지 확인합니다.

업데이트가 진행 중인 경우 이 경고는 임시입니다.
업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.

Name: CephOSDVersionMismatch

Message:여러 버전의 스토리지 서비스가 실행되고 있습니다.

설명:{{ $value }} 버전의 Ceph OSD 구성 요소가 실행 중입니다.

심각도: 경고

해결 방법 : 수정

프로시저: 사용자 인터페이스를 검사하고 기록한 후 업데이트가 진행 중인지 확인합니다.

업데이트가 진행 중인 경우 이 경고는 임시입니다.
업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.

이름:CephClusterCriticallyFull

메시지:스토리지 클러스터는 매우 가득 차 있으며 즉각적인 확장이 필요합니다.

설명:스토리지 클러스터 사용률이 85%를 초과했습니다.

심각도: Crtical

해결 방법 : 수정

프로시저: 불필요한 데이터를 제거하거나 클러스터를 확장합니다.

Name: CephClusterNearFull

수정 사항:스토리지 클러스터가 가득 차 있습니다. 확장이 필요합니다.

설명:스토리지 클러스터 사용률이 75%를 초과했습니다.

심각도: 경고

해결 방법 : 수정

프로시저: 불필요한 데이터를 제거하거나 클러스터를 확장합니다.

Name: NooBaaBucketErrorState

메시지:NooBaa Bucket이 오류 상태입니다.

설명:NooBaa 버킷 {{ $labels.bucket_name }}은 6m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 해결 방법

procedure:비정상 버킷의 오류 코드를 찾습니다.

Name: NooBaaNamespaceResourceErrorState

메시지:NooBaa 네임 스페이스 리소스가 오류 상태입니다.

설명:NooBaa 네임스페이스 리소스 {{ $labels.namespace_resource_name }}은 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 수정

procedure:비정상 네임스페이스 저장소 리소스의 오류 코드 찾기

Name: NooBaaNamespaceBucketErrorState

메시지:NooBaa Namespace Bucket이 오류 상태입니다.

설명:NooBaa 네임스페이스 버킷 {{ $labels.bucket_name }}은 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 수정

procedure:비정상 버킷의 오류 코드를 찾습니다.

Name: CephMdsMissingReplicas

메시지:스토리지 메타데이터 서비스에 대한 충분한 복제본입니다.

Description: '최소 필수 복제본은 사용할 수 없습니다.

스토리지 클러스터 작동에 영향을 미칠 수 있습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

절차:

경고 및 Operator 상태를 확인합니다.
문제를 확인할 수 없는 경우 Red Hat 지원에 문의하십시오.

이름:CephMgrIsAbsent

Message:스토리지 메트릭 수집기 서비스를 더 이상 사용할 수 없습니다.

설명:Ceph Manager가 Prometheus 대상 검색에서 사라졌습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

사용자 인터페이스 및 로그를 검사하고 업데이트가 진행 중인지 확인합니다.
- 업데이트가 진행 중인 경우 이 경고는 임시입니다.
- 업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.
업그레이드가 완료되면 경고 및 Operator 상태를 확인합니다.
문제가 지속되거나 식별할 수 없는 경우 Red Hat 지원팀에 문의하십시오.

Name: CephNodeDown

메시지:스토리지 노드 {{ $labels.node }}이 다운됨

설명:스토리지 노드 {{ $labels.node }}가 중단되었습니다. 노드를 즉시 확인합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

어떤 노드가 작동을 중지했는지와 그 원인을 확인합니다.
노드를 복구하기 위해 적절한 작업을 수행합니다. 노드를 복구할 수 없는 경우:
- Red Hat OpenShift Data Foundation의 스토리지 노드 교체를 참조하십시오.
- Red Hat 지원에 문의하십시오.

Name: CephClusterErrorState

메시지:스토리지 클러스터가 오류 상태입니다.

설명 : 스토리지 클러스터는 10m 이상 오류 상태입니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

경고 및 Operator 상태를 확인합니다.
문제를 식별할 수 없는 경우 must-gather 를 사용하여 로그 파일 및 진단 정보를 다운로드합니다.
must-gather 출력을 첨부하여 Red Hat 지원팀으로 지원 티켓을 엽니 다.

Name: CephClusterWarningState

메시지:스토리지 클러스터의 성능이 저하됨

설명 : 스토리지 클러스터는 10m 이상 경고 상태입니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

절차:

경고 및 Operator 상태를 확인합니다.
문제를 식별할 수 없는 경우 must-gather 를 사용하여 로그 파일 및 진단 정보를 다운로드합니다.
must-gather 출력을 첨부하여 Red Hat 지원팀으로 지원 티켓을 엽니 다.

Name: CephDataRecoveryTakingTooLong

메시지:데이터 복구 속도가 느리다

설명:데이터 복구가 너무 오래 활성화되었습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephOSDDiskNotResponding

메시지:디스크가 응답하지 않음

설명:디스크 장치 {{ $labels.device }}는 호스트 {{ $labels.host }}에서 응답하지 않습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: CephOSDDiskUnavailable

메시지:액세스할 수 없는 디스크

설명:디스크 장치 {{ $labels.device }}는 호스트 {{$labels.host }}에서 액세스할 수 없습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: CephPGRepairTakingTooLong

메시지:감지된 자체 복구 문제

설명:자체 복구 작업이 너무 오래 걸립니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephMonHighNumberOfLeaderChanges

메시지:스토리지 클러스터에 최근 많은 리더 변경 사항이 발생했습니다.

설명:'Ceph Monitor "{{ $labels.job }}": 인스턴스 {{ $labels.instance }}이 최근 분당 {{ $value "%.2f" }} 리더가 변경되었습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephMonQuorumAtRisk

Message : 스토리지 쿼럼 위험

설명:스토리지 클러스터 쿼럼이 낮습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: ClusterObjectStoreState

메시지:클러스터 오브젝트 저장소는 비정상 상태입니다. Ceph 클러스터 상태 를 확인합니다.

설명:클러스터 오브젝트 저장소는 15s 이상 비정상 상태입니다. Ceph 클러스터 상태 를 확인합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

CephObjectStore CR 인스턴스를 확인합니다.
Red Hat 지원에 문의하십시오.

Name: CephOSDFlapping

메시지:스토리지 데몬 osd.x가 지난 5분 동안 5회 재시작되었습니다. Pod 이벤트 또는 Ceph 상태를 확인하여 원인을 확인합니다.

설명:스토리지 OSD는 5분 내에 5회 이상 재시작 합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: OdfPoolMirroringImageHealth

메시지:풀 <pool-name> 풀의 이미지 미러링(PV)은 1m 이상 경고 상태에 있습니다. 미러링이 예상대로 작동하지 않을 수 있습니다.

설명: 재해 복구는 하나 또는 몇 가지 애플리케이션에서 실패합니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: OdfMirrorDaemonStatus

메시지:미러 데몬은 비정상입니다.

설명: 전체 클러스터에서 재해 복구에 실패합니다. 미러 데몬은 1m 이상 비정상 상태입니다. 이 클러스터의 미러링이 예상대로 작동하지 않습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

7장. OpenShift Data Foundation의 경고 및 오류 문제 해결

7.1. 경고 및 오류 해결
링크 복사

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 소개

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

7장. OpenShift Data Foundation의 경고 및 오류 문제 해결

7.1. 경고 및 오류 해결링크 복사링크가 클립보드에 복사되었습니다!

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 소개

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

7.1. 경고 및 오류 해결
링크 복사