Datadog 가이드로 Ceph 모니터링
Guide on Monitoring Ceph with Datadog
초록
1장. Datadog 및 Ceph 모니터링 링크 복사링크가 클립보드에 복사되었습니다!
Datadog 는 Ceph와의 통합을 통해 Datadog에서 출력을 실행하고 처리할 수 있습니다.
-
Ceph 상태 -
Ceph 상태 세부 정보 -
Ceph df 세부 정보 -
Ceph osd perf; 및 -
Ceph osd 풀 통계.
통합을 통해 Datadog는 다음을 수행할 수 있습니다.
- Red Hat Ceph Storage 클러스터의 상태 및 상태를 모니터링합니다.
- I/O 및 성능 지표를 모니터링합니다.
- 스토리지 풀 전반에서 디스크 사용량을 추적합니다.
Datadog 사용
Datadog 를 사용하여 Ceph를 모니터링하려면 하나 이상의 Ceph 모니터 노드에 Datadog 에이전트를 설치해야 합니다. Ceph를 모니터링할 때 Datadog 에이전트는 Ceph 명령줄 인수를 실행합니다. 따라서 각 Ceph 노드에는 일반적으로 /etc/ceph 에서 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키가 있어야 합니다. 에이전트가 Ceph 명령을 실행하면 Red Hat Ceph Storage 클러스터 상태와 통계를 Datadog로 다시 보냅니다. 그러면 Datadog가 Datadog 사용자 인터페이스에 상태 및 통계를 표시합니다.
Datadog는 에이전트를 사용하므로 Red Hat Ceph Storage 클러스터는 인터넷에 연결할 수 있어야 합니다. 그러나 Red Hat Ceph Storage 클러스터는 인터넷에서 연결할 필요가 없습니다.
Datadog는 Red Hat Ceph Storage 버전 2 이상을 사용하여 ceph 상태 검색을 지원합니다. Datadog는 dd-agent 의 후속 릴리스에서 Red Hat Ceph Storage 클러스터 3의 ceph 상태를 지원하는 업데이트를 제공합니다.
Red Hat은 이 문서를 고객에게 서비스로 제공하기 위해 기술 파트너와 협력합니다. 그러나 Red Hat은 이 제품에 대한 지원을 제공하지 않습니다. 이 제품에 대한 기술 지원이 필요한 경우 Datadog에 문의하여 지원을 받으십시오.
2장. Ceph 통합을 위한 Datadog 설치 링크 복사링크가 클립보드에 복사되었습니다!
Datadog 에이전트를 설치한 후 Datadog 에이전트가 Datadog에 Ceph 지표를 보고하도록 구성합니다.
사전 요구 사항
- Ceph 모니터 노드에 대한 루트 수준 액세스.
- Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
- 인터넷 접속.
절차
Ceph 통합을 설치합니다.
- Datadog 앱에 로그인합니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.
- 통합을 클릭합니다.
- 검색 필드에 ceph 를 입력하거나 Ceph 통합을 찾으려면 스크롤합니다. 사용자 인터페이스는 Ceph 통합이 사용 가능한지 아니면 이미 설치되어 있는지 여부가 표시됩니다.
사용할 수 있는 경우 버튼을 클릭하여 설치합니다.
Ceph용 Datadog 에이전트 구성
Datadog Agent 구성 디렉터리로 이동합니다.
cd /etc/dd-agent/conf.d
[root@mon ~]# cd /etc/dd-agent/conf.dCopy to Clipboard Copied! Toggle word wrap Toggle overflow ceph.yml.sample파일에서ceph.yaml파일을 생성합니다.cp ceph.yaml.example ceph.yaml
[root@mon ~]# cp ceph.yaml.example ceph.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow ceph.yaml파일을 수정합니다.vim ceph.yaml
[root@mon ~]# vim ceph.yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 예제
다음은 수정된
ceph.yaml파일의 샘플입니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow -tags,-name,ceph_command,ceph_cluster,use_sudo: True줄의 주석을 제거합니다.ceph_command및ceph_cluster의 기본값은 각각/usr/bin/ceph및ceph입니다.완료되면 다음과 같이 표시됩니다.
Copy to Clipboard Copied! Toggle word wrap Toggle overflow sudoers 파일을 수정합니다.
visudo
[root@mon ~]# visudoCopy to Clipboard Copied! Toggle word wrap Toggle overflow 다음 행을 추가합니다.
dd-agent ALL=(ALL) NOPASSWD:/usr/bin/ceph
dd-agent ALL=(ALL) NOPASSWD:/usr/bin/cephCopy to Clipboard Copied! Toggle word wrap Toggle overflow Ceph 호스트가 재부팅되는 경우 Datadog 에이전트를 활성화합니다.
systemctl enable datadog-agent
[root@mon ~]# systemctl enable datadog-agentCopy to Clipboard Copied! Toggle word wrap Toggle overflow Datadog 에이전트를 다시 시작합니다.
systemctl status datadog-agent
[root@mon ~]# systemctl status datadog-agentCopy to Clipboard Copied! Toggle word wrap Toggle overflow
3장. Ceph용 Datadog 에이전트 설치 및 구성 링크 복사링크가 클립보드에 복사되었습니다!
Ceph용 Datadog 에이전트를 설치하고 Ceph 데이터를 Datadog App에 보고하도록 구성합니다.
사전 요구 사항
- Ceph 모니터 노드에 대한 루트 수준 액세스.
- Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
- 인터넷 접속.
절차
- Datadog 앱에 로그인합니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.
통합을 클릭합니다. 명령줄에서 에이전트를 설치하려면 화면 상단에 있는 에이전트 탭을 클릭합니다.
명령줄을 열고 1단계 명령줄 에이전트 설치를 입력합니다.
예제
DD_API_KEY=KEY-STRING bash -c "$(curl -L https://raw.githubusercontent.com/DataDog/dd-agent/master/packaging/datadog-agent/source/install_agent.sh)"
[root@mon ~]# DD_API_KEY=KEY-STRING bash -c "$(curl -L https://raw.githubusercontent.com/DataDog/dd-agent/master/packaging/datadog-agent/source/install_agent.sh)"Copy to Clipboard Copied! Toggle word wrap Toggle overflow
키가 위의 예와 각 사용자 계정과 다르기 때문에 Datadog 사용자 인터페이스에서 예제를 복사합니다.
4장. Datadog를 사용하여 Ceph 개요 보기 링크 복사링크가 클립보드에 복사되었습니다!
Datadog와 Ceph를 설치하고 구성한 후 Datadog 앱으로 돌아갑니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.
사전 요구 사항
- 인터넷 접속.
절차
대시보드 위로 커서를 이동하여 하위 메뉴를 노출한 다음 Ceph Overview 를 클릭합니다.
Datadog는 Ceph Storage 클러스터에 대한 개요를 보여줍니다.
- Dashboards(대시보드)New Dashboard (새 대시보드)를 클릭하여 사용자 지정 Ceph 대시보드를 만듭니다.
5장. Datadog에 대한 Ceph 지표 링크 복사링크가 클립보드에 복사되었습니다!
Datadog 에이전트는 Ceph에서 다음 메트릭을 수집합니다. 이러한 메트릭은 사용자 정의 대시보드 및 경고에 포함될 수 있습니다.
| 메트릭 이름 | 설명 |
|---|---|
|
| 저널에 작업을 커밋하는 데 걸린 시간입니다. |
|
| 디스크에 업데이트를 플러시하는 데 걸린 시간입니다. |
|
| 지정된 풀에 대한 초당 I/O 작업 수입니다. |
|
| 읽은 초당 바이트 수입니다. |
|
| 쓸 초당 바이트 수입니다. |
|
| 알려진 스토리지 데몬 수입니다. |
|
| 참여하는 스토리지 데몬 수입니다. |
|
| 온라인 스토리지 데몬 수입니다. |
|
| 사용 가능한 배치 그룹 수입니다. |
|
| 모니터 데몬 수입니다. |
|
| 전체 용량 사용량 지표입니다. |
|
| 기본 오브젝트 저장소의 오브젝트 수입니다. |
|
| 지정된 풀의 오브젝트 수입니다. |
|
| 풀당 읽기 바이트 수입니다. |
|
| 풀당 쓰기 바이트입니다. |
|
| 풀 수입니다. |
|
|
|
|
| 풀당 초당 읽기 작업 수입니다. |
|
| 초당 풀별 쓰기 작업입니다. |
|
| 거의 전체 OSD 수입니다. |
|
| 전체 OSD 수입니다. |
|
| 전체 또는 거의 전체 OSD에서 사용되는 백분율입니다. |
6장. Datadog에서 경고 생성 링크 복사링크가 클립보드에 복사되었습니다!
관리자는 Red Hat Ceph Storage 클러스터의 지표를 추적하고 경고를 생성하는 모니터를 생성할 수 있습니다. 예를 들어 OSD가 다운된 경우 Datadog는 관리자에게 하나 이상의 OSD가 다운되었음을 경고할 수 있습니다.
사전 요구 사항
- Ceph Monitor 노드에 대한 루트 수준 액세스.
- Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
- 인터넷 접속.
절차
모니터를 클릭하여 Datadog 모니터 의 개요를 확인합니다.
- 모니터를 만들려면 Monitors(모니터)New Monitor 를 선택합니다.
진단 방법을 선택합니다. 예를 들면 "Threshold Alert"입니다.
-
지표를 정의합니다. 고급 경고를 만들려면 Advanced… 링크를 클릭합니다. 그런 다음 콤보 상자에서 메트릭을 선택합니다. 예를 들어
ceph.num_in_osdsCeph 지표를 선택합니다. Add Query+ 를 클릭하여 다른 쿼리를 추가합니다.
콤보 상자에서 다른 메트릭을 선택합니다. 예를 들어
ceph.num_up_osdsCeph 지표를 선택합니다.-
Express 이러한 쿼리 필드에
a-b를 입력합니다. 여기서a는ceph.num_in_osds의 값이며b는ceph.num_up_osds입니다. 차이가1개 이상인 경우 하나 이상의 OSD가 다운됩니다. - 경고 조건을 설정합니다. 예를 들어 트리거를 위 또는 같음으로 설정하고 임계값은 합계로, 시간을 1분으로 늘립니다.
-
경고 임계값 필드를
1로 설정합니다. 클러스터에 하나 이상의 OSD가 있고 실행 중이 아닌 경우 모니터에서 사용자에게 경고합니다. - 프리뷰 및 편집 아래의 입력 필드에 모니터 제목을 지정합니다. 이는 모니터를 저장하는 데 필요합니다.
텍스트 필드에 경고에 대한 설명을 입력합니다.
참고text 필드는 메트릭 변수 및 마크다운 구문을 지원합니다.
- 경고의 구독자를 추가합니다. 그러면 텍스트 필드에 이메일 주소가 추가됩니다. 경고가 트리거되면 사용자가 경고를 받습니다.