홈
제품
Red Hat Ceph Storage
5
문제 해결 가이드
부록 B. Ceph 클러스터의 상태 메시지

부록 B. Ceph 클러스터의 상태 메시지

Red Hat Ceph Storage 클러스터에서 늘릴 수 있는 일련의 가능한 상태 메시지가 표시됩니다. 이들은 고유 식별자를 가진 상태 검사로 정의됩니다. 식별자는 도구를 사용하여 상태 점검을 감지하고 의미를 반영하는 방식으로 제시할 수 있도록 설계된terse pseudo-human-readable 문자열입니다.

Expand

표 B.1. 모니터
상태 코드	설명
`DAEMON_OLD_VERSION`	데몬에서 이전 버전의 Ceph가 실행 중인지 경고합니다. 여러 버전이 감지되면 상태 오류가 생성됩니다.
`MON_DOWN`	하나 이상의 Ceph Monitor 데몬이 현재 다운되었습니다.
`MON_CLOCK_SKEW`	`ceph-mon` 데몬을 실행하는 노드의 클럭은 충분히 동기화되지 않습니다. `ntpd` 또는 `chrony` 를 사용하여 클럭을 동기화하여 해결합니다.
`MON_MSGR2_NOT_ENABLED`	`ms_bind_msgr2` 옵션이 활성화되어 있지만 클러스터의 monmap에서 v2 포트에 바인딩하도록 하나 이상의 Ceph Monitor가 구성되지 않았습니다. `ceph mon enable-msgr2` 명령을 실행하여 이 문제를 해결합니다.
`MON_DISK_LOW`	하나 이상의 Ceph 모니터가 디스크 공간보다 낮습니다.
`MON_DISK_CRIT`	하나 이상의 Ceph 모니터는 디스크 공간의 매우 낮은 수준입니다.
`MON_DISK_BIG`	하나 이상의 Ceph 모니터의 데이터베이스 크기가 매우 큽니다.
`AUTH_INSECURE_GLOBAL_ID_RECLAIM`	하나 이상의 클라이언트 또는 데몬은 Ceph 모니터에 다시 연결할 때 `global_id` 를 안전하게 회수하지 않는 스토리지 클러스터에 연결됩니다.
`AUTH_INSECURE_GLOBAL_ID_RECLAIM_ALLOWED`	현재 Ceph는 `auth_allow_insecure _global_ reclaim이 true 로 설정되었기 때문에 안전하지 않은 프로세스를 사용하여 모니터에 다시 연결할` 수 있도록 구성되어 있습니다.

Expand

표 B.2. 관리자
상태 코드	설명
`MGR_DOWN`	현재 모든 Ceph Manager 데몬이 종료되었습니다.
`MGR_MODULE_DEPENDENCY`	활성화된 Ceph Manager 모듈이 종속성 확인에 실패했습니다.
`MGR_MODULE_ERROR`	Ceph Manager 모듈에 예기치 않은 오류가 발생했습니다. 일반적으로 이는 모듈 serve 함수에서 처리되지 않은 예외가 발생했음을 의미합니다.

Expand

표 B.3. OSDs
상태 코드	설명
`OSD_DOWN`	하나 이상의 OSD가 축소되었습니다.
`OSD_CRUSH_TYPE_DOWN`	특정 CRUSH 하위 트리 내의 모든 OSD가 다운된 상태(예: 호스트의 모든 OSD)가 표시됩니다. 예를 들어 OSD_HOST_DOWN 및 OSD_ROOT_DOWN
`OSD_ORPHAN`	OSD는 CRUSH 맵 계층에서 참조되지만 존재하지 않습니다. `ceph osd crush rm osd._OSD_ID` 명령을 실행하여 OSD를 제거합니다.
`OSD_OUT_OF_ORDER_FULL`	가까운full ,backfillfull , full 또는 failsafefull 의 사용률 임계값은 오름차순이 아닙니다. `ceph osd set-nearfull-ratio RATIO`, `ceph osd set-backfillfull-ratio RATIO` 및 `ceph osd set-full-ratio RATIO`를 실행하여 임계값을 조정합니다.
`OSD_FULL`	하나 이상의 OSD가 전체 임계값을 초과했으며 스토리지 클러스터가 쓰기 작업을 수행하지 못하도록 합니다. 전체 임계값을 작은 margin `ceph osd set-full-ratio RATIO` 로 높여 쓰기 가용성을 복원합니다.
`OSD_BACKFILLFULL`	하나 이상의 OSD가 백필full 임계값을 초과하여 데이터가 이 장치로 리밸런스될 수 없도록 합니다.
`OSD_NEARFULL`	하나 이상의 OSD가 가까운full 임계값을 초과했습니다.
`OSDMAP_FLAGS`	관심 있는 하나 이상의 스토리지 클러스터 플래그가 설정되었습니다. 이러한 플래그에는 전체,pauserd,pause rd ,no up,noin,noout,norecover,norebalance,no rebalance ,nodeep_scrub, notieragent 등이 있습니다. 전체 를 제외하고, `ceph osd set FLAG및 ceph osd unset FLAG 명령을 사용하여 플래그` 를 지울 수 있습니다.
`OSD_FLAGS`	하나 이상의 OSD 또는 CRUSH에 관심 플래그가 설정되어 있습니다. 이 플래그에는 noup,nodown,noin, noout 이 포함됩니다.
`OLD_CRUSH_TUNABLES`	CRUSH 맵은 매우 오래된 설정을 사용하며 업데이트해야 합니다.
`OLD_CRUSH_STRAW_CALC_VERSION`	CRUSH 맵은 `straw` 버킷에 대한 중간 가중치 값을 계산하기 위해 최적화되지 않은 이전 방법을 사용합니다.
`CACHE_POOL_NO_HIT_SET`	하나 이상의 캐시 풀은 사용률을 추적하도록 구성된 적정으로 구성되지 않으므로 계층화 에이전트가 캐시에서 플러시 및 제거될 cold 오브젝트를 식별할 수 없습니다. `ceph osd 풀 set_ POOL_NAME _ hit_set_type TYPE, ceph osd pool set POOL_NAME hit_set_period PERIOD_SECONDS`, `ceph osd pool set POOL_count NUMBER_OF_HIT_SETS를 사용하여 캐시 풀에서 적중` 세트를 구성합니다. 및 `ceph osd 풀은 POOL_NAME hit_set_fpp EXTRAGET _FALSE_POSITIVE_RATE` 명령을 설정합니다.
`OSD_NO_SORTBITWISE`	`sortbitwise` 플래그가 설정되어 있지 않습니다. `ceph osd set sortbitwise` 명령을 사용하여 플래그를 설정합니다.
`POOL_FULL`	하나 이상의 풀이 할당량에 도달했으며 더 이상 쓰기를 허용하지 않습니다. `ceph osd 풀 set-quota POOL_NAME max_objects NUMBER_OF_OBJECTS` 및 `ceph osd pool set-quota POOL_NAME max_bytes BYTES` 를 사용하여 풀 할당량을 늘리거나 사용률을 줄이기 위해 기존 데이터를 삭제합니다.
`BLUEFS_SPILLOVER`	BlueStore 백엔드를 사용하는 하나 이상의 OSD는 db 파티션이 할당되었지만 해당 공간에는 일반 느린 장치에 "침착"이 있습니다. `ceph config set osd bluestore_warn_on_bluefs_spillover false` 명령을 사용하여 비활성화합니다.
`BLUEFS_AVAILABLE_SPACE`	이 출력은 BDEV_DB 무료 ,BDEV_SLOW 무료* 및 available_ from_bluestore* 의 세 가지 값을 제공합니다.
`BLUEFS_LOW_SPACE`	BlueStore File System (BlueFS)이 사용 가능한 공간에 부족하고 사용 `가능한_from_bluestore` 가 있는 경우 BlueFS 할당 단위 크기를 줄일 수 있습니다.
`BLUESTORE_FRAGMENTATION`	BlueStore는 기본 스토리지에서 사용 가능한 공간을 작동하므로 조각화됩니다. 이는 정상적이고 피할 수 없지만 과도한 조각화는 느려집니다.
`BLUESTORE_LEGACY_STATFS`	bluestore는 풀 단위로 내부 사용량 통계를 추적하며 하나 이상의 OSD에는 BlueStore 볼륨이 있습니다. `ceph config set global bluestore_warn_on_legacy_statfs false` 명령을 사용하여 경고를 비활성화합니다.
`BLUESTORE_NO_PER_POOL_OMAP`	bluestore는 풀별 omap 공간 사용률을 추적합니다. `ceph config set global bluestore_warn_on_no_per_pool_omap false` 명령을 사용하여 경고를 비활성화합니다.
`BLUESTORE_NO_PER_PG_OMAP`	bluestore는 PG에 의해 omap 공간 사용률을 추적합니다. `ceph config set global bluestore_warn_on_no_per_pg_omap false` 명령을 사용하여 경고를 비활성화합니다.
`BLUESTORE_DISK_SIZE_MISMATCH`	BlueStore를 사용하는 하나 이상의 OSD에는 물리 장치의 크기와 메타데이터를 추적하는 메타데이터 사이에 내부 불일치가 있습니다.
`BLUESTORE_NO_COMPRESSION` `	하나 이상의 OSD가 BlueStore 압축 플러그인을 로드할 수 없습니다. 이는 손상된 설치로 인해 `ceph-osd` 바이너리가 압축 플러그인과 일치하지 않거나 `ceph-osd` 데몬 재시작을 포함하지 않은 최근 업그레이드로 인해 발생할 수 있습니다.
`BLUESTORE_SPURIOUS_READ_ERRORS`	BlueStore를 사용하는 하나 이상의 OSD는 메인 장치에서 오래된 읽기 오류를 감지합니다. bluestore는 디스크 읽기를 다시 시도하여 이러한 오류로부터 복구되었습니다.

Expand

표 B.4. 장치 상태
상태 코드	설명
`DEVICE_HEALTH`	하나 이상의 장치가 곧 실패할 것으로 예상되며, 여기서 경고 임계값은 `mgr/devicehealth/warn_threshold` 구성 옵션에 의해 제어됩니다. 장치를 출력 하여 데이터를 마이그레이션하고 하드웨어를 교체합니다.
`DEVICE_HEALTH_IN_USE`	하나 이상의 장치가 곧 실패할 것으로 예상되며 `mgr/devicehealth/mark_out_threshold` 를 기반으로 스토리지 클러스터의 "out"으로 표시되었지만 여전히 더 많은 PG에 참여하고 있습니다.
`DEVICE_HEALTH_TOOMANY`	너무 많은 장치가 곧 실패 할 것으로 예상되고 `mgr/devicehealth/self_heal` 동작이 활성화되어 있으며 모든 실용 장치를 표시하는 것이 너무 많은 OSD가 자동으로 표시되지 않도록 클러스터 `mon_osd_min_in_ratio` 비율을 초과합니다.

Expand

표 B.5. 풀 및 배치 그룹
상태 코드	설명
`PG_AVAILABILITY`	데이터 가용성이 감소되므로 스토리지 클러스터에서 클러스터의 일부 데이터에 대한 잠재적인 읽기 또는 쓰기 요청을 서비스할 수 없습니다.
`PG_DEGRADED`	일부 데이터에 대해 데이터 중복성이 감소되므로 스토리지 클러스터에 복제된 풀에 대해 원하는 개수의 복제본이 없거나 코드 조각이 삭제됩니다.
`PG_RECOVERY_FULL`	스토리지 클러스터에서 여유 공간이 부족하기 때문에 데이터 중복성을 줄일 수 있습니다. 특히 하나 이상의 PGs에 `recovery_too full` 플래그가 설정되어 있어 하나 이상의 OSD가 전체 임계값 이상이므로 클러스터를 마이그레이션하거나 복구할 수 없습니다.
`PG_BACKFILL_FULL`	스토리지 클러스터에서 사용 가능한 공간이 부족하거나 일부 데이터의 경우 데이터 중복성을 줄일 수 있습니다. 특히 하나 이상의 PGs에 `backfill_toofull` 플래그가 설정되어 있어 하나 이상의 OSD가 `백fillfull` 임계값 이상이므로 클러스터를 마이그레이션하거나 복구할 수 없습니다.
`PG_DAMAGED`	데이터 스크럽링은 스토리지 클러스터의 데이터 일관성, 특히 하나 이상의 PG가 일관되지 않거나 `스냅인` 업이 문제를 발견했거나, `복구` 플래그가 설정되어 있거나, 이러한 불일치의 복구가 현재 진행 중인 것으로 나타났습니다.
`OSD_SCRUB_ERRORS`	최근 OSD Scrubs가 불일치를 발견했습니다.
`OSD_TOO_MANY_REPAIRS`	읽기 오류가 발생하고 다른 복제본을 사용할 수 있으면 즉시 오류를 복구하여 클라이언트에서 개체 데이터를 가져올 수 있습니다.
`LARGE_OMAP_OBJECTS`	하나 이상의 풀에는 o `sd_deep_scrub_large_omap_object_threshold 또는 osd_ deep_scrub_large_object_value_sum_threshold 또는 둘 다에 따라 결정되는 큰 omap 오브젝트` 가 포함됩니다. `ceph config set osd_deep_scrub_large_omap_object_key_threshold KEYS` 및 `ceph config set osd_deep_scrub_large_large_omap_object_sum_threshold BYTES` 명령을 사용하여 임계값을 조정합니다.
`CACHE_POOL_NEAR_FULL`	캐시 계층 풀은 거의 가득 차 있습니다. `ceph osd pool set CACHE_POOL_NAME target_max_bytes BYTES` 및 `ceph osd pool set CACHE_POOL_NAME target_max_bytes BYTES` 명령을 사용하여 캐시 풀 대상 크기를 조정합니다.
`TOO_FEW_PGS`	스토리지 클러스터에서 사용 중인 PG의 수는 OSD당 `mon_pg_warn_min_per_osd` PG의 구성 가능한 임계값보다 낮습니다.
`POOL_PG_NUM_NOT_POWER_OF_TWO`	하나 이상의 풀에는 2의 전원이 아닌 `pg_num` 값이 있습니다. `ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false` 명령을 사용하여 경고를 비활성화합니다.
`POOL_TOO_FEW_PGS`	하나 이상의 풀에는 현재 풀에 저장된 데이터의 양에 따라 더 많은 PG가 있어야 합니다. `ceph osd pool set POOL_autoscale_mode off 명령을 사용하여 PG의 자동 확장을 비활성화하고, ceph os d pool set POOL_ NAME pg_autoscale_mode를 사용하여 PG의 수를 자동으로 조정하거나 ceph osd pool set POOL_ NAME pg_num _NEW_PG_ NUMER 명령을 사용하여 PG의 수` 를 수동으로 설정할 수 있습니다.
`TOO_MANY_PGS`	스토리지 클러스터에서 사용 중인 PG의 수는 OSD당 `mon_max_pg_per_osd` PGs의 구성 가능한 임계값보다 큽니다. 하드웨어를 추가하여 클러스터에서 OSD 수를 늘립니다.
`POOL_TOO_MANY_PGS`	하나 이상의 풀에는 현재 풀에 저장된 데이터의 양에 따라 더 많은 PG가 있어야 합니다. `ceph osd pool set POOL_autoscale_mode off 명령을 사용하여 PG의 자동 확장을 비활성화하고, ceph os d pool set POOL_ NAME pg_autoscale_mode를 사용하여 PG의 수를 자동으로 조정하거나 ceph osd pool set POOL_ NAME pg_num _NEW_PG_ NUMER 명령을 사용하여 PG의 수` 를 수동으로 설정할 수 있습니다.
`POOL_TARGET_SIZE_BYTES_OVERCOMMITTED`	하나 이상의 풀에는 `target_size_bytes` 속성이 설정되어 풀의 예상 크기를 추정하지만 값은 사용 가능한 총 스토리지를 초과합니다. `ceph osd pool set POOL_NAME target_size_bytes 0 명령을 사용하여 풀의 값을 0` 으로 설정합니다.
`POOL_HAS_TARGET_SIZE_BYTES_AND_RATIO`	하나 이상의 풀에 `target_size_bytes` 및 `target_size_ratio` 가 모두 풀의 예상 크기를 추정하도록 설정되어 있습니다. `ceph osd pool set POOL_NAME target_size_bytes 0 명령을 사용하여 풀의 값을 0` 으로 설정합니다.
`TOO_FEW_OSDS`	스토리지 클러스터의 OSD 수는 `o'sd_pool_default_size` 의 구성 가능한 임계값 미만입니다.
`SMALLER_PGP_NUM`	하나 이상의 풀에 `pgp_num` 보다 작은 pgp `_num` 값이 있습니다. 이는 일반적으로 PG 수가 배치 동작을 늘리지 않고 증가했음을 나타냅니다. `pgp_num` 을 `ceph osd pool set POOL _ NAME pgp_num PG_NUM_VALUE` 명령과 일치하도록 설정합니다.
`MANY_OBJECTS_PER_PG`	하나 이상의 풀은 전체 스토리지 클러스터 평균보다 훨씬 높은 PG당 평균 오브젝트 수를 갖습니다. 특정 임계값은 `mon_pg_warn_max_object_skew` 구성 값으로 제어됩니다.
`POOL_APP_NOT_ENABLED`	하나 이상의 오브젝트가 포함되어 있지만 특정 애플리케이션에서 사용하도록 태그가 지정되지 않은 풀이 있습니다. `rbd 풀 init POOL_NAME명령이 있는 애플리케이션에서 사용할 풀에` 레이블을 지정하여 이 경고를 해결합니다.
`POOL_FULL`	하나 이상의 풀이 할당량에 도달했습니다. 이 오류 조건을 트리거하는 임계값은 `mon_pool_quota_crit_threshold` 구성 옵션으로 제어합니다.
`POOL_NEAR_FULL`	하나 이상의 풀이 구성된 완전성 임계값에 접근하고 있습니다. `ceph osd pool set-quota POOL_NAME max_objects NUMBER_OF_OBJECTS` 및 `ceph osd pool set-quota POOL_NAME max_bytes BYTES` 명령으로 풀 할당량을 조정합니다.
`OBJECT_MISPLACED`	스토리지 클러스터에서 하나 이상의 오브젝트가 스토리지 클러스터를 저장하려는 노드에 저장되지 않습니다. 이는 일부 최근 스토리지 클러스터 변경으로 인한 데이터 마이그레이션이 아직 완료되지 않았음을 나타냅니다.
`OBJECT_UNFOUND`	스토리지 클러스터에 있는 하나 이상의 오브젝트를 찾을 수 없습니다. 특히 OSD는 새 개체 또는 업데이트된 개체 복사본이 있어야 하지만 현재 온라인 상태인 OSD에서 해당 오브젝트 버전의 복사본을 찾을 수 없다는 것을 알고 있습니다.
`SLOW_OPS`	하나 이상의 OSD 또는 모니터 요청을 처리하는 데 시간이 오래 걸립니다. 이는 극단적인 부하, 느린 저장 장치 또는 소프트웨어 버그의 표시일 수 있습니다.
`PG_NOT_SCRUBBED`	하나 이상의 PG가 최근에 스크럽되지 않았습니다. PGS는 일반적으로 `osd_scrub_max_interval` 에 의해 지정된 모든 간격 내에서 스크럽됩니다. `ceph pg scrub PG_ID` 명령을 사용하여 scrub를 시작합니다.
`PG_NOT_DEEP_SCRUBBED`	하나 이상의 PG가 최근 딥 스크럽되지 않았습니다. `ceph pg deep-scrub PG_ID` 명령을 사용하여 scrub을 시작합니다. PGS는 일반적으로 모든 `osd_deep_scrub_interval` 초를 스크럽하며, `mon_warn_pg_not_deep_deep_scrued_ratio` 간격의 백분율이 0crub 없이 경과했을 때 이 경고가 트리거됩니다.
`PG_SLOW_SNAP_TRIMMING`	하나 이상의 PGs에 대한 스냅샷 트리밍 큐는 구성된 경고 임계값을 초과했습니다. 이는 최근에 많은 수의 스냅샷이 삭제되었거나 OSD가 스냅샷을 빠르게 트리밍하여 새 스냅샷 삭제 속도를 유지할 수 없음을 나타냅니다.

Expand

표 B.6. 기타
상태 코드	설명
`RECENT_CRASH`	최근에 하나 이상의 Ceph 데몬이 중단되었으며, 해당 충돌은 관리자가 아직 확인하지 않았습니다.
`TELEMETRY_CHANGED`	Telemetry가 활성화되어 있지만 Telemetry 보고서의 콘텐츠가 그 이후로 변경되어 Telemetry 보고서가 전송되지 않습니다.
`AUTH_BAD_CAPS`	하나 이상의 인증 사용자에게 모니터에서 구문 분석할 수 없는 기능이 있습니다. `ceph auth ENTITY_NAME DAEMON_TYPE CAPS` 명령을 사용하여 사용자의 기능을 업데이트합니다.
`OSD_NO_DOWN_OUT_INTERVAL`	`mon_osd_down_out_interval` 옵션이 0으로 설정되어 있으므로 OSD가 실패한 후 시스템이 복구 또는 복구 작업을 자동으로 수행하지 않습니다. `ceph config global mon_warn_on_osd_down_out_zero false 명령으로 간격` 을 음소거합니다.
`DASHBOARD_DEBUG`	대시보드 디버그 모드가 활성화되어 있습니다. 즉, REST API 요청을 처리하는 동안 오류가 있는 경우 HTTP 오류 응답에 Python traceback이 포함됩니다. `ceph dashboard debug disable` 명령을 사용하여 디버그 모드를 비활성화합니다.

부록 B. Ceph 클러스터의 상태 메시지

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 소개

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 문서 정보

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links