5.2. 환경 모니터링


이 섹션에서는 테스트 중 환경을 모니터링하는 데 중점을 두고 있습니다. 이 섹션에서는 변경 사항을 확인하는 데 필요한 모니터만 다룹니다. 전용 터미널에서 이러한 모니터를 실행하는 것이 좋습니다. 테스트 중에 변경 사항을 감지하려면 테스트를 시작하기 전에 모니터링을 시작하는 것이 좋습니다.

Useful Commands 섹션에는 더 많은 예제가 표시됩니다.

5.2.1. 기본 노드 검색

기본 노드를 검색하여 장애 조치를 모니터링하거나 기본 노드에서 실행될 때 복제 상태에 대한 정보만 제공하는 특정 명령을 실행해야 합니다.

기본 노드를 검색하려면 다음 명령을 < sid>adm 사용자로 실행할 수 있습니다.

clusternode1:rh2adm> watch -n 5 'hdbnsutil -sr_stateConfiguration | egrep -e "primary masters|^mode"'
Copy to Clipboard Toggle word wrap

출력 예: clusternode2가 기본 데이터베이스인 경우:

mode: syncmem
primary masters: clusternode2
Copy to Clipboard Toggle word wrap

기본 데이터베이스를 실행하는 노드의 출력은 다음과 같습니다.

mode: primary
Copy to Clipboard Toggle word wrap

5.2.2. 복제 상태 확인

복제 상태에는 주 데이터베이스 노드와 복제의 현재 상태 간의 관계가 표시됩니다.

복제 상태를 검색하려면 < sid>adm 사용자로 실행할 수 있습니다.

clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration
Copy to Clipboard Toggle word wrap

시스템 복제 상태의 변경 사항을 영구적으로 모니터링하려면 다음 명령을 실행하십시오.

clusternode1:rh2adm> watch -n 5 'python /usr/sap/${SAPSYSTEMNAME}/HDB${TINSTANCE}/exe/python_support/systemReplicationStatus.py ; echo Status $?'
Copy to Clipboard Toggle word wrap

이 예제에서는 현재 반환 코드를 결정합니다.
반환 코드(상태)가 15이면 복제 상태가 정상입니다. 다른 반환 코드는 다음과 같습니다.

  • 10: NoHSR
  • 11: 오류
  • 12: 알 수 없음
  • 13: 초기화
  • 14: 동기화
  • 15: active

새 보조를 등록하는 경우 기본 노드의 별도의 창에서 실행할 수 있으며 복제 진행 상황을 확인할 수 있습니다. 장애 조치(failover)를 모니터링하려는 경우 이전 주 데이터베이스 서버는 물론 새 주 데이터베이스 서버에서 병렬로 실행할 수 있습니다.If you want to monitor a failover, you can run it in parallel on the old primary as well as on the new primary database server. 자세한 내용은 Check SAP HANA System Replication Status 를 참조하십시오.

5.2.3. /var/log/messages 항목 확인

Pacemaker에서 /var/log/messages 파일에 많은 정보를 쓰고 있습니다. 장애 조치 중에 이 메시지 파일에 많은 수의 메시지가 기록됩니다. SAP HANA 리소스 에이전트에 따라 중요한 메시지만 팔로우하려면 pacemaker SAP 리소스의 자세한 활동을 필터링하는 것이 좋습니다. 단일 클러스터 노드에서 메시지 파일을 확인하는 것으로 충분합니다.

예를 들어 다음 별칭을 사용할 수 있습니다.

[root@clusternode1]# tmsl='tail -1000f /var/log/messages | egrep -s "Setting master-rsc_SAPHana_$SAPSYSTEMNAME_HDB${TINSTANCE}|sr_register|WAITING4LPA|PROMOTED|DEMOTED|UNDEFINED|master_walk|SWAIT|WaitforStopped|FAILED|LPT"'
Copy to Clipboard Toggle word wrap

별도의 창에서 tmsl 을 실행하여 테스트 진행 상황을 모니터링합니다. 모니터 장애 조치 및 동기화 상태 예제도 확인하십시오.

5.2.4. 클러스터 상태

클러스터 상태를 확인하는 방법은 여러 가지가 있습니다.

  • 클러스터가 실행 중인지 확인합니다.

    • pcs 클러스터 상태
  • 클러스터 및 모든 리소스를 확인합니다.

    • pcs status
  • 클러스터, 모든 리소스 및 모든 노드 속성을 확인합니다.

    • pcs status --full
  • 리소스만 확인합니다.

    • pcs 리소스

pcs status --full 명령은 필요한 모든 정보를 제공합니다. 변경 사항을 모니터링하려면 watch를 사용하여 이 명령을 실행할 수 있습니다.

[root@clusternode1]# watch pcs status --full
Copy to Clipboard Toggle word wrap

출력 예 및 추가 옵션은 클러스터 상태 확인 에서 확인할 수 있습니다.

5.2.5. leftovers 검색

다음 테스트를 실행할 준비가 되었는지 확인하려면 이전 테스트의 남은 기간을 수정하거나 제거해야 합니다.

  • STONITH 는 클러스터의 노드를 펜싱하는 데 사용됩니다.

    • detect: [root@clusternode1]# pcs stonith history
    • 수정: [root@clusternode1]# pcs stonith cleanup
  • 여러 기본 데이터베이스:

    • detect: clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration | grep -i primary

      동일한 기본 노드를 식별해야 합니다.

    • 수정: --force_full_replica옵션을 사용하여 잘못된 기본 사항을 다시 등록합니다.
  • 이동으로 인한 위치 제한:

    • detect: [root@clusternode1]# pcs constraint location

      warning 섹션을 확인합니다.

    • 수정: [root@clusternode1]# pcs resource clear <clone-resource-which was moved>
  • 보조 복제 관계:

    • detect: 기본 데이터베이스에서 clusternode1:rh2adm> python $DIR_EXECU Cryostat/python_support/systemReplicationStatus.py를 실행합니다.
    • 수정: 보조 데이터베이스를 등록 취소하고 다시 등록합니다.
  • Check siteReplicationMode (모든 SAP HANA 노드에서 동일한 출력)

    • clusternode1:rh2adm> hdbnsutil -sr_state --sapcontrol=1 |grep site.*Mode
  • pcs 속성:

    • detect: [root@clusternode1]# pcs property config
    • 수정: [root@clusternode1]# pcs 속성 설정 <key=value>
  • 명확한 유지 관리 모드.

    • [root@clusternode1]# pcs property set maintenance-mode=false
  • log_mode:

    • detect: clusternode1:rh2adm> python systemReplicationStatus.py

      는 일반적으로 log_mode 가 필요한 복제 상태에 응답합니다. log_modehdbsql을 사용하여 Inifile 내용을 확인하는 데 설명된 대로 감지할 수 있습니다.

    • 수정: log_mode 를 normal로 변경하고 주 데이터베이스를 다시 시작합니다.
  • CIB 항목:

  • cleanup/clear:

    • detect: [root@clusternode1]# pcs status --full

      종종 오류 또는 경고를 표시합니다. 리소스를 정리/삭제할 수 있으며 모든 것이 정상이면 아무 일도 발생하지 않습니다. 다음 테스트를 실행하기 전에 환경을 정리할 수 있습니다.

    • 수정할 예제:

      [root@clusternode1]# pcs resource clear <name-of-the-clone-resource>[root@clusternode1]# pcs resource cleanup <name-of-the-clone-resource>

이 기능은 기존 환경에 문제가 있는지 확인하려는 경우에도 유용합니다.

자세한 내용은 Useful 명령을 참조하십시오.

맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat