Datadog 가이드로 Ceph 모니터링


Red Hat Ceph Storage 6

Guide on Monitoring Ceph with Datadog

Red Hat Ceph Storage Documentation Team

초록

이 문서에서는 Datadog 모니터링 툴을 사용하여 Ceph Storage 클러스터의 상태 모니터링에 대한 정보를 제공합니다.
Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 용어를 교체하기 위해 최선을 다하고 있습니다. 먼저 마스터(master), 슬레이브(slave), 블랙리스트(blacklist), 화이트리스트(whitelist) 등 네 가지 용어를 교체하고 있습니다. 이러한 변경 작업은 작업 범위가 크므로 향후 여러 릴리스에 걸쳐 점차 구현할 예정입니다. 자세한 내용은 CTO Chris Wright의 메시지에서 참조하십시오.

1장. Datadog 및 Ceph 모니터링

Datadog 는 Ceph와의 통합을 통해 Datadog에서 출력을 실행하고 처리할 수 있습니다.

  • Ceph 상태
  • Ceph 상태 세부 정보
  • Ceph df 세부 정보
  • Ceph osd perf; 및
  • Ceph osd 풀 통계.

통합을 통해 Datadog는 다음을 수행할 수 있습니다.

  • Red Hat Ceph Storage 클러스터의 상태 및 상태를 모니터링합니다.
  • I/O 및 성능 지표를 모니터링합니다.
  • 스토리지 풀 전반에서 디스크 사용량을 추적합니다.

Datadog 사용

Datadog 를 사용하여 Ceph를 모니터링하려면 하나 이상의 Ceph 모니터 노드에 Datadog 에이전트를 설치해야 합니다. Ceph를 모니터링할 때 Datadog 에이전트는 Ceph 명령줄 인수를 실행합니다. 따라서 각 Ceph 노드에는 일반적으로 /etc/ceph 에서 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키가 있어야 합니다. 에이전트가 Ceph 명령을 실행하면 Red Hat Ceph Storage 클러스터 상태와 통계를 Datadog로 다시 보냅니다. 그러면 Datadog가 Datadog 사용자 인터페이스에 상태 및 통계를 표시합니다.

Datadog는 에이전트를 사용하므로 Red Hat Ceph Storage 클러스터는 인터넷에 연결할 수 있어야 합니다. 그러나 Red Hat Ceph Storage 클러스터는 인터넷에서 연결할 필요가 없습니다.

참고

Datadog는 Red Hat Ceph Storage 버전 2 이상을 사용하여 ceph 상태 검색을 지원합니다. Datadog는 dd-agent 의 후속 릴리스에서 Red Hat Ceph Storage 클러스터 3의 ceph 상태를 지원하는 업데이트를 제공합니다.

중요

Red Hat은 이 문서를 고객에게 서비스로 제공하기 위해 기술 파트너와 협력합니다. 그러나 Red Hat은 이 제품에 대한 지원을 제공하지 않습니다. 이 제품에 대한 기술 지원이 필요한 경우 Datadog에 문의하여 지원을 받으십시오.

2장. Ceph 통합을 위한 Datadog 설치

Datadog 에이전트를 설치한 후 Datadog 에이전트가 Datadog에 Ceph 지표를 보고하도록 구성합니다.

사전 요구 사항

  • Ceph 모니터 노드에 대한 루트 수준 액세스.
  • Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
  • 인터넷 접속.

절차

  1. Ceph 통합을 설치합니다.

    1. Datadog 앱에 로그인합니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.
    2. 통합을 클릭합니다.
    3. 검색 필드에 ceph 를 입력하거나 Ceph 통합을 찾으려면 스크롤합니다. 사용자 인터페이스는 Ceph 통합이 사용 가능한지 아니면 이미 설치되어 있는지 여부가 표시됩니다.
    4. 사용할 수 있는 경우 버튼을 클릭하여 설치합니다.

  2. Ceph용 Datadog 에이전트 구성

    1. Datadog Agent 구성 디렉터리로 이동합니다.

      [root@mon ~]# cd /etc/dd-agent/conf.d
      Copy to Clipboard Toggle word wrap
    2. ceph.yml.sample 파일에서 ceph.yaml 파일을 생성합니다.

      [root@mon ~]# cp ceph.yaml.example ceph.yaml
      Copy to Clipboard Toggle word wrap
    3. ceph.yaml 파일을 수정합니다.

      [root@mon ~]# vim ceph.yaml
      Copy to Clipboard Toggle word wrap

      예제

      다음은 수정된 ceph.yaml 파일의 샘플입니다.

      init_config:
      
      instances:
      #  - tags:
      #    - name:mars_cluster
      #
      #    ceph_cmd: /usr/bin/ceph
      #    ceph_cluster: ceph
      #
      # If your environment requires sudo, please add a line like:
      #          dd-agent ALL=(ALL) NOPASSWD:/usr/bin/ceph
      # to your sudoers file, and uncomment the below option.
      #
      #    use_sudo: True
      Copy to Clipboard Toggle word wrap

      -tags,-name,ceph_command,ceph_cluster, use_sudo: True 줄의 주석을 제거합니다. ceph_commandceph_cluster 의 기본값은 각각 /usr/bin/cephceph 입니다.

      완료되면 다음과 같이 표시됩니다.

      init_config:
      
      instances:
        - tags:
          - name:ceph-RHEL
      #
          ceph_cmd: /usr/bin/ceph
          ceph_cluster: ceph
      #
      # If your environment requires sudo, please add a line like:
      #          dd-agent ALL=(ALL) NOPASSWD:/usr/bin/ceph
      # to your sudoers file, and uncomment the below option.
      #
          use_sudo: True
      Copy to Clipboard Toggle word wrap
    4. sudoers 파일을 수정합니다.

      [root@mon ~]# visudo
      Copy to Clipboard Toggle word wrap
    5. 다음 행을 추가합니다.

      dd-agent ALL=(ALL) NOPASSWD:/usr/bin/ceph
      Copy to Clipboard Toggle word wrap
    6. Ceph 호스트가 재부팅되는 경우 Datadog 에이전트를 활성화합니다.

      [root@mon ~]# systemctl enable datadog-agent
      Copy to Clipboard Toggle word wrap
    7. Datadog 에이전트를 다시 시작합니다.

      [root@mon ~]# systemctl status datadog-agent
      Copy to Clipboard Toggle word wrap

3장. Ceph용 Datadog 에이전트 설치 및 구성

Ceph용 Datadog 에이전트를 설치하고 Ceph 데이터를 Datadog App에 보고하도록 구성합니다.

사전 요구 사항

  • Ceph 모니터 노드에 대한 루트 수준 액세스.
  • Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
  • 인터넷 접속.

절차

  1. Datadog 앱에 로그인합니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.
  2. 통합을 클릭합니다. 명령줄에서 에이전트를 설치하려면 화면 상단에 있는 에이전트 탭을 클릭합니다.

  3. 명령줄을 열고 1단계 명령줄 에이전트 설치를 입력합니다.

    예제

    [root@mon ~]# DD_API_KEY=KEY-STRING bash -c "$(curl -L https://raw.githubusercontent.com/DataDog/dd-agent/master/packaging/datadog-agent/source/install_agent.sh)"
    Copy to Clipboard Toggle word wrap

참고

키가 위의 예와 각 사용자 계정과 다르기 때문에 Datadog 사용자 인터페이스에서 예제를 복사합니다.

4장. Datadog를 사용하여 Ceph 개요 보기

Datadog와 Ceph를 설치하고 구성한 후 Datadog 앱으로 돌아갑니다. 사용자 인터페이스는 화면 왼쪽에 탐색이 표시됩니다.

사전 요구 사항

  • 인터넷 접속.

절차

  1. 대시보드 위로 커서를 이동하여 하위 메뉴를 노출한 다음 Ceph Overview 를 클릭합니다.

    Datadog는 Ceph Storage 클러스터에 대한 개요를 보여줍니다.

  2. Dashboards(대시보드)New Dashboard (새 대시보드)를 클릭하여 사용자 지정 Ceph 대시보드를 만듭니다.

5장. Datadog에 대한 Ceph 지표

Datadog 에이전트는 Ceph에서 다음 메트릭을 수집합니다. 이러한 메트릭은 사용자 정의 대시보드 및 경고에 포함될 수 있습니다.

Expand
메트릭 이름설명

ceph.commit_latency_ms

저널에 작업을 커밋하는 데 걸린 시간입니다.

ceph.apply_latency_ms

디스크에 업데이트를 플러시하는 데 걸린 시간입니다.

ceph.op_per_sec

지정된 풀에 대한 초당 I/O 작업 수입니다.

ceph.read_bytes_sec

읽은 초당 바이트 수입니다.

ceph.write_bytes_sec

쓸 초당 바이트 수입니다.

ceph.num_osds

알려진 스토리지 데몬 수입니다.

ceph.num_in_osds

참여하는 스토리지 데몬 수입니다.

ceph.num_up_osds

온라인 스토리지 데몬 수입니다.

ceph.num_pgs

사용 가능한 배치 그룹 수입니다.

ceph.num_mons

모니터 데몬 수입니다.

ceph.aggregate_pct_used

전체 용량 사용량 지표입니다.

ceph.total_objects

기본 오브젝트 저장소의 오브젝트 수입니다.

ceph.num_objects

지정된 풀의 오브젝트 수입니다.

ceph.read_bytes

풀당 읽기 바이트 수입니다.

ceph.write_bytes

풀당 쓰기 바이트입니다.

ceph.num_pools

풀 수입니다.

ceph.pgstate.active_clean

active+clean 배치 그룹의 수입니다.

ceph.read_op_per_sec

풀당 초당 읽기 작업 수입니다.

ceph.write_op_per_sec

초당 풀별 쓰기 작업입니다.

ceph.num_near_full_osds

거의 전체 OSD 수입니다.

ceph.num_full_osds

전체 OSD 수입니다.

ceph.osd.pct_used

전체 또는 거의 전체 OSD에서 사용되는 백분율입니다.

6장. Datadog에서 경고 생성

관리자는 Red Hat Ceph Storage 클러스터의 지표를 추적하고 경고를 생성하는 모니터를 생성할 수 있습니다. 예를 들어 OSD가 다운된 경우 Datadog는 관리자에게 하나 이상의 OSD가 다운되었음을 경고할 수 있습니다.

사전 요구 사항

  • Ceph Monitor 노드에 대한 루트 수준 액세스.
  • Red Hat Ceph Storage 클러스터에 대한 액세스를 제공하는 적절한 Ceph 키입니다.
  • 인터넷 접속.

절차

  1. 모니터를 클릭하여 Datadog 모니터 의 개요를 확인합니다.

  2. 모니터를 만들려면 Monitors(모니터)New Monitor 를 선택합니다.
  3. 진단 방법을 선택합니다. 예를 들면 "Threshold Alert"입니다.

  4. 지표를 정의합니다. 고급 경고를 만들려면 Advanced…​ 링크를 클릭합니다. 그런 다음 콤보 상자에서 메트릭을 선택합니다. 예를 들어 ceph.num_in_osds Ceph 지표를 선택합니다.
  5. Add Query+ 를 클릭하여 다른 쿼리를 추가합니다.

  6. 콤보 상자에서 다른 메트릭을 선택합니다. 예를 들어 ceph.num_up_osds Ceph 지표를 선택합니다.

  7. Express 이러한 쿼리 필드에 a-b 를 입력합니다. 여기서 aceph.num_in_osds 의 값이며 bceph.num_up_osds 입니다. 차이가 1 개 이상인 경우 하나 이상의 OSD가 다운됩니다.
  8. 경고 조건을 설정합니다. 예를 들어 트리거를 위 또는 같음으로 설정하고 임계값은 합계로, 시간을 1분으로 늘립니다.
  9. 경고 임계값 필드를 1 로 설정합니다. 클러스터에 하나 이상의 OSD가 있고 실행 중이 아닌 경우 모니터에서 사용자에게 경고합니다.
  10. 프리뷰편집 아래의 입력 필드에 모니터 제목을 지정합니다. 이는 모니터를 저장하는 데 필요합니다.
  11. 텍스트 필드에 경고에 대한 설명을 입력합니다.

    참고

    text 필드는 메트릭 변수 및 마크다운 구문을 지원합니다.

  12. 경고의 구독자를 추가합니다. 그러면 텍스트 필드에 이메일 주소가 추가됩니다. 경고가 트리거되면 사용자가 경고를 받습니다.

법적 공지

Copyright © 2025 Red Hat, Inc.
The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.
Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.
Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.
Linux® is the registered trademark of Linus Torvalds in the United States and other countries.
Java® is a registered trademark of Oracle and/or its affiliates.
XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.
MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.
Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.
The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.
All other trademarks are the property of their respective owners.
맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat