12.5. Cephadm 상태 점검


스토리지 관리자는 Cephadm 모듈에서 제공하는 추가 상태 확인을 사용하여 Red Hat Ceph Storage 클러스터를 모니터링할 수 있습니다. 이는 스토리지 클러스터에서 제공하는 기본 상태 점검의 보조입니다.

12.5.1. 사전 요구 사항

  • 실행 중인 Red Hat Ceph Storage 클러스터.

12.5.2. Cephadm 작업 상태 점검

Cephadm 모듈이 활성화되면 상태 점검이 실행됩니다. 다음과 같은 상태 경고를 받을 수 있습니다.

CEPHADM_PAUSED

ceph orch pause 명령을 사용하여 Cephadm 백그라운드 작업이 일시 중지되었습니다. Cephadm은 호스트 및 데몬 상태 확인과 같은 수동 모니터링 활동을 계속 수행하지만 데몬 배포 또는 제거와 같은 변경은 하지 않습니다. ceph orch resume 명령을 사용하여 Cephadm 작업을 다시 시작할 수 있습니다.

CEPHADM_STRAY_HOST

하나 이상의 호스트가 Ceph 데몬을 실행하고 있지만 Cephadm 모듈에서 관리하는 호스트로 등록되지 않습니다. 즉, 해당 서비스는 현재 Cephadm에서 관리하지 않습니다(예: ceph orch ps 명령에 포함된 재시작 및 업그레이드). ceph orch host add HOST_NAME 명령을 사용하여 호스트를 관리할 수 있지만 원격 호스트에 대한 SSH 액세스가 구성되어 있는지 확인합니다. 또는 호스트에 수동으로 연결하고 해당 호스트의 서비스가 제거되거나 Cephadm에서 관리하는 호스트로 마이그레이션되었는지 확인할 수 있습니다. ceph config set mgr mgr/cephadm/warn_on_stray_hosts false설정을 사용하여 이 경고를 비활성화할 수도 있습니다.

CEPHADM_STRAY_DAEMON

하나 이상의 Ceph 데몬이 실행 중이지만 Cephadm 모듈에서는 관리되지 않습니다. 이는 다른 도구를 사용하여 배포되었거나 수동으로 시작되었기 때문일 수 있습니다. 이러한 서비스는 현재 Cephadm에서 관리하지 않습니다(예: ceph orch ps 명령에 포함된 재시작 및 업그레이드 등).

데몬이 모니터 또는 OSD 데몬인 상태 저장 장치인 경우 Cephadm에서 해당 데몬을 채택해야 합니다. 상태 비저장 데몬의 경우 ceph orch apply 명령을 사용하여 새 데몬을 프로비저닝한 다음 관리되지 않는 데몬을 중지할 수 있습니다.

ceph config set mgr mgr/cephadm/warn_on_stray_daemons false 를 사용하여 이 상태 경고를 비활성화할 수 있습니다.

CEPHADM_HOST_CHECK_FAILED

기본 Cephadm 호스트 검사에 실패한 하나 이상의 호스트가:name: value를 확인합니다.

  • 호스트에 연결할 수 있으며 Cephadm을 실행할 수 있습니다.
  • 호스트는 Podman의 작업 컨테이너 런타임 및 작업 시간 동기화와 같은 기본 사전 요구 사항을 충족합니다. 이 테스트가 실패하면 Cephadm이 해당 호스트에서 서비스를 관리할 수 없습니다.

ceph cephadm check-host HOST_NAME 명령을 사용하여 이 검사를 수동으로 실행할 수 있습니다. ceph orch 호스트 rm HOST_NAME명령을 사용하여 관리에서 손상된 호스트 를 제거할 수 있습니다. ceph config set mgr mgr/cephadm/warn_on_failed_host_check false 를 사용하여 이 상태 경고를 비활성화할 수 있습니다.

12.5.3. Cephadm 구성 상태 점검

Cephadm은 스토리지 클러스터의 각 호스트를 주기적으로 검사하여 OS, 디스크 및 NIC의 상태를 확인합니다. 이러한 팩트는 스토리지 클러스터의 호스트 간에 일관성을 분석하여 이상한 구성을 식별합니다. 구성 검사는 선택적 기능입니다.

  • 다음 명령을 사용하여 이 기능을 활성화할 수 있습니다.

    예제

    [ceph: root@host01 /]# ceph config set mgr mgr/cephadm/config_checks_enabled true

각 호스트 검사 후에 구성 검사가 트리거됩니다. 이는 1분 동안 지속됩니다.

  • ceph -W cephadm 명령은 다음과 같이 현재 상태 및 구성 검사의 로그 항목을 표시합니다.

    비활성화 상태

    예제

    ALL cephadm checks are disabled, use 'ceph config set mgr mgr/cephadm/config_checks_enabled true' to enable

    enabled 상태

    예제

    CEPHADM 8/8 checks enabled and executed (0 bypassed, 0 disabled). No issues detected

    설정 검사 자체는 여러 cephadm 하위 명령을 통해 관리됩니다.

  • 구성 검사 활성화 여부를 확인하려면 다음 명령을 실행합니다.

    예제

    [ceph: root@host01 /]# ceph cephadm config-check status

    이 명령은 구성 검사기의 상태를 Enabled 또는 Disabled 로 반환합니다.

  • 구성 검사 및 현재 상태를 모두 나열하려면 다음 명령을 실행합니다.

    예제

    [ceph: root@host01 /]# ceph cephadm config-check ls
    NAME             HEALTHCHECK                      STATUS   DESCRIPTION
    kernel_security  CEPHADM_CHECK_KERNEL_LSM         enabled  checks SELINUX/Apparmor profiles are consistent across cluster hosts
    os_subscription  CEPHADM_CHECK_SUBSCRIPTION       enabled  checks subscription states are consistent for all cluster hosts
    public_network   CEPHADM_CHECK_PUBLIC_MEMBERSHIP  enabled  check that all hosts have a NIC on the Ceph public_netork
    osd_mtu_size     CEPHADM_CHECK_MTU                enabled  check that OSD hosts share a common MTU setting
    osd_linkspeed    CEPHADM_CHECK_LINKSPEED          enabled  check that OSD hosts share a common linkspeed
    network_missing  CEPHADM_CHECK_NETWORK_MISSING    enabled  checks that the cluster/public networks defined exist on the Ceph hosts
    ceph_release     CEPHADM_CHECK_CEPH_RELEASE       enabled  check for Ceph version consistency - ceph daemons should be on the same release (unless upgrade is active)
    kernel_version   CEPHADM_CHECK_KERNEL_VERSION     enabled  checks that the MAJ.MIN of the kernel on Ceph hosts is consistent

각 구성 검사는 다음과 같이 설명되어 있습니다.

CEPHADM_CHECK_KERNEL_LSM

스토리지 클러스터 내의 각 호스트는 동일한 Linux Security Module (LSM) 상태 내에서 작동할 것으로 예상됩니다. 예를 들어, 대다수의 호스트가 강제 모드에서 SELINUX를 사용하여 실행 중인 경우 이 모드에서 실행되지 않는 모든 호스트에는 예기치 않게 플래그가 지정되고 경고 상태가 있는 상태 확인이 발생합니다.

CEPHADM_CHECK_SUBSCRIPTION

이 점검은 공급 업체 서브스크립션의 상태와 관련이 있습니다. 이 검사는 Red Hat Enterprise Linux를 사용하는 호스트에 대해서만 수행되지만 패치 및 업데이트를 사용할 수 있도록 모든 호스트가 활성 서브스크립션을 통해 적용되는지 확인하는 데 도움이 됩니다.

CEPHADM_CHECK_PUBLIC_MEMBERSHIP

클러스터의 모든 멤버는 공용 네트워크 서브넷 중 하나 이상에 NIC가 구성되어 있어야 합니다. 공용 네트워크에 없는 호스트는 라우팅에 따라 성능에 영향을 미칠 수 있습니다.

CEPHADM_CHECK_MTU

OSD에서 NIC의 최대 전송 단위(MTU)는 일관된 성능의 핵심 요소가 될 수 있습니다. 이 검사에서는 OSD 서비스를 실행하는 호스트를 검사하여 MTU가 클러스터 내에서 일관되게 구성되었는지 확인합니다. 이는 대부분의 호스트가 사용 중인 MTU 설정을 설정하여 확인되며, 이로 인해 Ceph 상태 확인을 초래할 수 있습니다.

CEPHADM_CHECK_LINKSPEED

MTU 검사와 유사하게 linkspeed consistency도 클러스터 성능에 영향을 미칩니다. 이 검사는 대부분의 OSD 호스트에서 공유하는 linkspeed를 결정하여 낮은 링크 속도로 설정된 모든 호스트에 대해 상태 확인을 수행합니다.

CEPHADM_CHECK_NETWORK_MISSING

public_networkcluster_network 설정은 IPv4 및 IPv6에 대한 서브넷 정의를 지원합니다. 스토리지 클러스터의 호스트에서 이러한 설정을 찾을 수 없는 경우 상태 점검이 발생합니다.

CEPHADM_CHECK_CEPH_RELEASE

일반 작업에서는 Ceph 클러스터가 동일한 Ceph 릴리스에서 데몬을 실행해야 합니다(예: 모든 Red Hat Ceph Storage 클러스터 5 릴리스). 이 검사는 각 데몬의 활성 릴리스를 살펴보고 모든 이상 상태를 상태 점검으로 보고합니다. 클러스터 내에서 업그레이드 프로세스가 활성화된 경우 이 검사를 바이패스합니다.

CEPHADM_CHECK_KERNEL_VERSION

OS 커널 버전은 호스트의 일관성을 확인합니다. 다시 한번, 대부분의 호스트가 이상하게 식별되는 기준으로 사용됩니다.

Red Hat logoGithubRedditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

© 2024 Red Hat, Inc.