7장. Ceph 대시보드에서 경고 관리
스토리지 관리자는 Red Hat Ceph Storage 대시보드에서 경고 세부 정보를 확인하고 음소거를 생성할 수 있습니다. 여기에는 다음과 같은 사전 정의된 경고가 포함됩니다.
- CephadmDaemonFailed
- CephadmPaused
- CephadmUpgradeFailed
- CephDaemonCrash
- CephDeviceFailurePredicted
- CephDeviceFailurePredictionTooHigh
- CephDeviceFailureRelocationIncomplete
- CephFilesystemDamaged
- CephFilesystemDegraded
- CephFilesystemFailureNoStandby
- CephFilesystemInsufficientStandby
- CephFilesystemMDSRanksLow
- CephFilesystemOffline
- CephFilesystemReadOnly
- CephHealthError
- CephHealthWarning
- CephMgrModuleCrash
- CephMgrPrometheusModuleInactive
- CephMonClockSkew
- CephMonDiskspaceCritical
- CephMonDiskspaceLow
- CephMonDown
- CephMonDownQuorumAtRisk
- CephNodeDiskspaceWarning
- CephNodeInconsistentMTU
- CephNodeNetworkPacketDrops
- CephNodeNetworkPacketErrors
- CephNodeRootFilesystemFull
- CephObjectMissing
- CephOSDBackfillFull
- CephOSDDown
- CephOSDDownHigh
- CephOSDFlapping
- CephOSDFull
- CephOSDHostDown
- CephOSDInternalDiskSizeMismatch
- CephOSDNearFull
- CephOSDReadErrors
- CephOSDTimeoutsClusterNetwork
- CephOSDTimeoutsPublicNetwork
- CephOSDTooManyRepairs
- CephPGBackfillAtRisk
- CephPGImbalance
- CephPGNotDeepScrubbed
- CephPGNotScrubbed
- CephPGRecoveryAtRisk
- CephPGsDamaged
- CephPGsHighPerOSD
- CephPGsInactive
- CephPGsUnclean
- CephPGUnavilableBlockingIO
- CephPoolBackfillFull
- CephPoolFull
- CephPoolGrowthWarning
- CephPoolNearFull
- CephSlowOps
- PrometheusJobMissing
그림 7.1. 사전 정의된 경고
간단한 네트워크 관리 프로토콜(SNMP) 트랩을 사용하여 경고를 모니터링할 수도 있습니다.
7.1. 모니터링 스택 활성화
명령줄 인터페이스를 사용하여 Prometheus, Alertmanager, Grafana와 같은 Red Hat Ceph Storage 클러스터의 모니터링 스택을 수동으로 활성화할 수 있습니다.
Prometheus 및 Alertmanager API를 사용하여 경고 및 음소거를 관리할 수 있습니다.
사전 요구 사항
- 실행 중인 Red Hat Ceph Storage 클러스터.
- 모든 호스트에 대한 루트 수준 액세스.
프로세스
cephadm
쉘에 로그인합니다.예
[root@host01 ~]# cephadm shell
모니터링 스택의 API를 설정합니다.
Alertmanager 서버의 호스트 및 포트를 지정합니다.
구문
ceph dashboard set-alertmanager-api-host ALERTMANAGER_API_HOST:PORT
예
[ceph: root@host01 /]# ceph dashboard set-alertmanager-api-host http://10.0.0.101:9093 Option ALERTMANAGER_API_HOST updated
구성된 경고를 보려면 Prometheus API에 대한 URL을 구성합니다. 이 API를 사용하여 Ceph 대시보드 UI는 새 음소거가 해당 경고와 일치하는지 확인합니다.
구문
ceph dashboard set-prometheus-api-host PROMETHEUS_API_HOST:PORT
예
[ceph: root@host01 /]# ceph dashboard set-prometheus-api-host http://10.0.0.101:9095 Option PROMETHEUS_API_HOST updated
호스트를 설정한 후 브라우저의 대시보드 창을 새로 고칩니다.
Grafana 서버의 호스트 및 포트를 지정합니다.
구문
ceph dashboard set-grafana-api-url GRAFANA_API_URL:PORT
예
[ceph: root@host01 /]# ceph dashboard set-grafana-api-url https://10.0.0.101:3000 Option GRAFANA_API_URL updated
Prometheus, Alertmanager 및 Grafana API 호스트 세부 정보를 가져옵니다.
예
[ceph: root@host01 /]# ceph dashboard get-alertmanager-api-host http://10.0.0.101:9093 [ceph: root@host01 /]# ceph dashboard get-prometheus-api-host http://10.0.0.101:9095 [ceph: root@host01 /]# ceph dashboard get-grafana-api-url http://10.0.0.101:3000
선택 사항: Prometheus, Alertmanager 또는 Grafana 설정에서 자체 서명된 인증서를 사용하는 경우 대시보드에서 인증서 확인을 비활성화하십시오. 이로 인해 알 수 없는 CA(인증 기관)에서 서명한 인증서로 인한 거부된 연결을 방지하거나 호스트 이름과 일치하지 않습니다.
Prometheus의 경우:
예
[ceph: root@host01 /]# ceph dashboard set-prometheus-api-ssl-verify False
Alertmanager의 경우:
예
[ceph: root@host01 /]# ceph dashboard set-alertmanager-api-ssl-verify False
Grafana의 경우:
예
[ceph: root@host01 /]# ceph dashboard set-grafana-api-ssl-verify False
Prometheus, Alertmanager 및 Grafana의 자체 서명 인증서 확인 설정에 대한 세부 정보를 가져옵니다.
예
[ceph: root@host01 /]# ceph dashboard get-prometheus-api-ssl-verify [ceph: root@host01 /]# ceph dashboard get-alertmanager-api-ssl-verify [ceph: root@host01 /]# ceph dashboard get-grafana-api-ssl-verify
선택 사항: 대시보드에 변경 사항이 반영되지 않으면 대시보드를 비활성화한 다음 활성화해야 합니다.
예
[ceph: root@host01 /]# ceph mgr module disable dashboard [ceph: root@host01 /]# ceph mgr module enable dashboard
추가 리소스
- Red Hat Ceph Storage 설치 가이드의 Bootstrap 명령 옵션 섹션을 참조하십시오.
- Red Hat Ceph Storage 설치 가이드의 Red Hat Ceph Storage 설치 장을 참조하십시오.
- Red Hat Ceph Storage Operations 가이드 의 Ceph Orchestrator를 사용하여 모니터링 스택 배포 섹션을 참조하십시오.