7장. OpenShift Data Foundation의 경고 및 오류 문제 해결


7.1. 경고 및 오류 해결

Red Hat OpenShift Data Foundation은 여러 일반적인 오류 시나리오를 감지하고 자동으로 해결할 수 있습니다. 그러나 일부 문제는 관리자의 개입이 필요합니다.

현재 실행 중인 오류를 알아보려면 다음 위치 중 하나를 확인합니다.

  • 모니터링 경고 실행 옵션
  • 개요 클러스터
  • 팝업 창에 있는 스토리지 데이터 기반 스토리지 시스템 스토리지 시스템 링크 개요 블록 및 파일
  • 팝업 개요 오브젝트 탭의 스토리지 스토리지 시스템 스토리지 시스템 스토리지 시스템 링크

표시된 오류를 복사하고 다음 섹션에서 검색하여 심각도 및 해상도를 확인합니다.

Expand

Name: CephMonVersionMismatch

Message:여러 버전의 스토리지 서비스가 실행되고 있습니다.

설명:{{ $value }} 버전의 Ceph Mon 구성 요소가 실행 중입니다.

심각도: 경고

해결 방법 : 수정

프로시저: 사용자 인터페이스를 검사하고 기록한 후 업데이트가 진행 중인지 확인합니다.

  • 업데이트가 진행 중인 경우 이 경고는 임시입니다.
  • 업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.

Name: CephOSDVersionMismatch

Message:여러 버전의 스토리지 서비스가 실행되고 있습니다.

설명:{{ $value }} 버전의 Ceph OSD 구성 요소가 실행 중입니다.

심각도: 경고

해결 방법 : 수정

프로시저: 사용자 인터페이스를 검사하고 기록한 후 업데이트가 진행 중인지 확인합니다.

  • 업데이트가 진행 중인 경우 이 경고는 임시입니다.
  • 업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.

이름:CephClusterCriticallyFull

메시지:스토리지 클러스터는 매우 가득 차 있으며 즉각적인 확장이 필요합니다.

설명:스토리지 클러스터 사용률이 85%를 초과했습니다.

심각도: Crtical

해결 방법 : 수정

프로시저: 불필요한 데이터를 제거하거나 클러스터를 확장합니다.

Name: CephClusterNearFull

수정 사항:스토리지 클러스터가 가득 차 있습니다. 확장이 필요합니다.

설명:스토리지 클러스터 사용률이 75%를 초과했습니다.

심각도: 경고

해결 방법 : 수정

프로시저: 불필요한 데이터를 제거하거나 클러스터를 확장합니다.

Name: NooBaaBucketErrorState

메시지:NooBaa Bucket이 오류 상태입니다.

설명:NooBaa 버킷 {{ $labels.bucket_name }}은 6m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 해결 방법

procedure:비정상 버킷의 오류 코드를 찾습니다.

Name: NooBaaNamespaceResourceErrorState

메시지:NooBaa 네임 스페이스 리소스가 오류 상태입니다.

설명:NooBaa 네임스페이스 리소스 {{ $labels.namespace_resource_name }}은 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 수정

procedure:비정상 네임스페이스 저장소 리소스의 오류 코드 찾기

Name: NooBaaNamespaceBucketErrorState

메시지:NooBaa Namespace Bucket이 오류 상태입니다.

설명:NooBaa 네임스페이스 버킷 {{ $labels.bucket_name }}은 5m 이상 오류 상태입니다.

심각도: 경고

해결 방법 : 수정

procedure:비정상 버킷의 오류 코드를 찾습니다.

Name: CephMdsMissingReplicas

메시지:스토리지 메타데이터 서비스에 대한 충분한 복제본입니다.

Description: '최소 필수 복제본은 사용할 수 없습니다.

스토리지 클러스터 작동에 영향을 미칠 수 있습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

절차:

  1. 경고 및 Operator 상태를 확인합니다.
  2. 문제를 확인할 수 없는 경우 Red Hat 지원에 문의하십시오.

이름:CephMgrIsAbsent

Message:스토리지 메트릭 수집기 서비스를 더 이상 사용할 수 없습니다.

설명:Ceph Manager가 Prometheus 대상 검색에서 사라졌습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

  1. 사용자 인터페이스 및 로그를 검사하고 업데이트가 진행 중인지 확인합니다.

    • 업데이트가 진행 중인 경우 이 경고는 임시입니다.
    • 업데이트가 진행 중이 아니면 업그레이드 프로세스를 다시 시작합니다.
  2. 업그레이드가 완료되면 경고 및 Operator 상태를 확인합니다.
  3. 문제가 지속되거나 식별할 수 없는 경우 Red Hat 지원팀에 문의하십시오.

Name: CephNodeDown

메시지:스토리지 노드 {{ $labels.node }}이 다운됨

설명:스토리지 노드 {{ $labels.node }}가 중단되었습니다. 노드를 즉시 확인합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

  1. 어떤 노드가 작동을 중지했는지와 그 원인을 확인합니다.
  2. 노드를 복구하기 위해 적절한 작업을 수행합니다. 노드를 복구할 수 없는 경우:

Name: CephClusterErrorState

메시지:스토리지 클러스터가 오류 상태입니다.

설명 : 스토리지 클러스터는 10m 이상 오류 상태입니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

  1. 경고 및 Operator 상태를 확인합니다.
  2. 문제를 식별할 수 없는 경우 must-gather 를 사용하여 로그 파일 및 진단 정보를 다운로드합니다.
  3. must-gather 출력을 첨부하여 Red Hat 지원팀으로 지원 티켓을 엽니 다.

Name: CephClusterWarningState

메시지:스토리지 클러스터의 성능이 저하됨

설명 : 스토리지 클러스터는 10m 이상 경고 상태입니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

절차:

  1. 경고 및 Operator 상태를 확인합니다.
  2. 문제를 식별할 수 없는 경우 must-gather 를 사용하여 로그 파일 및 진단 정보를 다운로드합니다.
  3. must-gather 출력을 첨부하여 Red Hat 지원팀으로 지원 티켓을 엽니 다.

Name: CephDataRecoveryTakingTooLong

메시지:데이터 복구 속도가 느리다

설명:데이터 복구가 너무 오래 활성화되었습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephOSDDiskNotResponding

메시지:디스크가 응답하지 않음

설명:디스크 장치 {{ $labels.device }}는 호스트 {{ $labels.host }}에서 응답하지 않습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: CephOSDDiskUnavailable

메시지:액세스할 수 없는 디스크

설명:디스크 장치 {{ $labels.device }}는 호스트 {{$labels.host }}에서 액세스할 수 없습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: CephPGRepairTakingTooLong

메시지:감지된 자체 복구 문제

설명:자체 복구 작업이 너무 오래 걸립니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephMonHighNumberOfLeaderChanges

메시지:스토리지 클러스터에 최근 많은 리더 변경 사항이 발생했습니다.

설명:'Ceph Monitor "{{ $labels.job }}": 인스턴스 {{ $labels.instance }}이 최근 분당 {{ $value "%.2f" }} 리더가 변경되었습니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: CephMonQuorumAtRisk

Message : 스토리지 쿼럼 위험

설명:스토리지 클러스터 쿼럼이 낮습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: ClusterObjectStoreState

메시지:클러스터 오브젝트 저장소는 비정상 상태입니다. Ceph 클러스터 상태 를 확인합니다.

설명:클러스터 오브젝트 저장소는 15s 이상 비정상 상태입니다. Ceph 클러스터 상태 를 확인합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

절차:

Name: CephOSDFlapping

메시지:스토리지 데몬 osd.x가 지난 5분 동안 5회 재시작되었습니다. Pod 이벤트 또는 Ceph 상태를 확인하여 원인을 확인합니다.

설명:스토리지 OSD는 5분 내에 5회 이상 재시작 합니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Name: OdfPoolMirroringImageHealth

메시지:풀 <pool-name> 풀의 이미지 미러링(PV)은 1m 이상 경고 상태에 있습니다. 미러링이 예상대로 작동하지 않을 수 있습니다.

설명: 재해 복구는 하나 또는 몇 가지 애플리케이션에서 실패합니다.

심각도: 경고

해결 방법 :Red Hat 지원 문의

Name: OdfMirrorDaemonStatus

메시지:미러 데몬은 비정상입니다.

설명: 전체 클러스터에서 재해 복구에 실패합니다. 미러 데몬은 1m 이상 비정상 상태입니다. 이 클러스터의 미러링이 예상대로 작동하지 않습니다.

심각도: 심각

해결 방법 :Red Hat 지원 문의

Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat
맨 위로 이동