5.2. 환경 모니터링
이 섹션에서는 테스트 중 환경을 모니터링하는 데 중점을 두고 있습니다. 이 섹션에서는 변경 사항을 확인하는 데 필요한 모니터만 다룹니다. 전용 터미널에서 이러한 모니터를 실행하는 것이 좋습니다. 테스트 중에 변경 사항을 감지하려면 테스트를 시작하기 전에 모니터링을 시작하는 것이 좋습니다.
Useful Commands 섹션에는 더 많은 예제가 표시됩니다.
5.2.1. 기본 노드 검색 링크 복사링크가 클립보드에 복사되었습니다!
기본 노드를 검색하여 장애 조치를 모니터링하거나 기본 노드에서 실행될 때 복제 상태에 대한 정보만 제공하는 특정 명령을 실행해야 합니다.
기본 노드를 검색하려면 다음 명령을 < sid>adm 사용자로 실행할 수 있습니다.
clusternode1:rh2adm> watch -n 5 'hdbnsutil -sr_stateConfiguration | egrep -e "primary masters|^mode"'
clusternode1:rh2adm> watch -n 5 'hdbnsutil -sr_stateConfiguration | egrep -e "primary masters|^mode"'
출력 예: clusternode2가 기본 데이터베이스인 경우:
mode: syncmem primary masters: clusternode2
mode: syncmem
primary masters: clusternode2
기본 데이터베이스를 실행하는 노드의 출력은 다음과 같습니다.
mode: primary
mode: primary
5.2.2. 복제 상태 확인 링크 복사링크가 클립보드에 복사되었습니다!
복제 상태에는 주 데이터베이스 노드와 복제의 현재 상태 간의 관계가 표시됩니다.
복제 상태를 검색하려면 < sid>adm 사용자로 실행할 수 있습니다.
clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration
clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration
시스템 복제 상태의 변경 사항을 영구적으로 모니터링하려면 다음 명령을 실행하십시오.
clusternode1:rh2adm> watch -n 5 'python /usr/sap/${SAPSYSTEMNAME}/HDB${TINSTANCE}/exe/python_support/systemReplicationStatus.py ; echo Status $?'
clusternode1:rh2adm> watch -n 5 'python /usr/sap/${SAPSYSTEMNAME}/HDB${TINSTANCE}/exe/python_support/systemReplicationStatus.py ; echo Status $?'
이 예제에서는 현재 반환 코드를 결정합니다.
반환 코드(상태)가 15이면 복제 상태가 정상입니다. 다른 반환 코드는 다음과 같습니다.
- 10: NoHSR
- 11: 오류
- 12: 알 수 없음
- 13: 초기화
- 14: 동기화
- 15: active
새 보조를 등록하는 경우 기본 노드의 별도의 창에서 실행할 수 있으며 복제 진행 상황을 확인할 수 있습니다. 장애 조치(failover)를 모니터링하려는 경우 이전 주 데이터베이스 서버는 물론 새 주 데이터베이스 서버에서 병렬로 실행할 수 있습니다.If you want to monitor a failover, you can run it in parallel on the old primary as well as on the new primary database server. 자세한 내용은 Check SAP HANA System Replication Status 를 참조하십시오.
5.2.3. /var/log/messages 항목 확인 링크 복사링크가 클립보드에 복사되었습니다!
Pacemaker에서 /var/log/messages 파일에 많은 정보를 쓰고 있습니다. 장애 조치 중에 이 메시지 파일에 많은 수의 메시지가 기록됩니다. SAP HANA 리소스 에이전트에 따라 중요한 메시지만 팔로우하려면 pacemaker SAP 리소스의 자세한 활동을 필터링하는 것이 좋습니다. 단일 클러스터 노드에서 메시지 파일을 확인하는 것으로 충분합니다.
예를 들어 다음 별칭을 사용할 수 있습니다.
tmsl='tail -1000f /var/log/messages | egrep -s "Setting master-rsc_SAPHana_$SAPSYSTEMNAME_HDB${TINSTANCE}|sr_register|WAITING4LPA|PROMOTED|DEMOTED|UNDEFINED|master_walk|SWAIT|WaitforStopped|FAILED|LPT"'
[root@clusternode1]# tmsl='tail -1000f /var/log/messages | egrep -s "Setting master-rsc_SAPHana_$SAPSYSTEMNAME_HDB${TINSTANCE}|sr_register|WAITING4LPA|PROMOTED|DEMOTED|UNDEFINED|master_walk|SWAIT|WaitforStopped|FAILED|LPT"'
별도의 창에서 tmsl 을 실행하여 테스트 진행 상황을 모니터링합니다. 모니터 장애 조치 및 동기화 상태 예제도 확인하십시오.
5.2.4. 클러스터 상태 링크 복사링크가 클립보드에 복사되었습니다!
클러스터 상태를 확인하는 방법은 여러 가지가 있습니다.
클러스터가 실행 중인지 확인합니다.
-
pcs 클러스터 상태
-
클러스터 및 모든 리소스를 확인합니다.
-
pcs status
-
클러스터, 모든 리소스 및 모든 노드 속성을 확인합니다.
-
pcs status --full
-
리소스만 확인합니다.
-
pcs 리소스
-
pcs status --full 명령은 필요한 모든 정보를 제공합니다. 변경 사항을 모니터링하려면 watch를 사용하여 이 명령을 실행할 수 있습니다.
watch pcs status --full
[root@clusternode1]# watch pcs status --full
출력 예 및 추가 옵션은 클러스터 상태 확인 에서 확인할 수 있습니다.
5.2.5. leftovers 검색 링크 복사링크가 클립보드에 복사되었습니다!
다음 테스트를 실행할 준비가 되었는지 확인하려면 이전 테스트의 남은 기간을 수정하거나 제거해야 합니다.
STONITH는 클러스터의 노드를 펜싱하는 데 사용됩니다.-
detect:
[root@clusternode1]# pcs stonith history -
수정:
[root@clusternode1]# pcs stonith cleanup
-
detect:
여러 기본 데이터베이스:
detect:
clusternode1:rh2adm> hdbnsutil -sr_stateConfiguration | grep -i primary동일한 기본 노드를 식별해야 합니다.
-
수정:
--force_full_replica옵션을 사용하여 잘못된 기본 사항을 다시 등록합니다.
이동으로 인한 위치 제한:
detect:
[root@clusternode1]# pcs constraint locationwarning 섹션을 확인합니다.
-
수정:
[root@clusternode1]# pcs resource clear <clone-resource-which was moved>
보조 복제 관계:
-
detect: 기본 데이터베이스에서
clusternode1:rh2adm> python $DIR_EXECU Cryostat/python_support/systemReplicationStatus.py를 실행합니다. - 수정: 보조 데이터베이스를 등록 취소하고 다시 등록합니다.
-
detect: 기본 데이터베이스에서
Check siteReplicationMode (모든 SAP HANA 노드에서 동일한 출력)
-
clusternode1:rh2adm> hdbnsutil -sr_state --sapcontrol=1 |grep site.*Mode
-
pcs 속성:
-
detect:
[root@clusternode1]# pcs property config -
수정:
[root@clusternode1]# pcs 속성 설정 <key=value>
-
detect:
명확한
유지 관리 모드.-
[root@clusternode1]# pcs property set maintenance-mode=false
-
log_mode:
detect:
clusternode1:rh2adm> python systemReplicationStatus.py는 일반적으로
log_mode가 필요한 복제 상태에 응답합니다.log_mode는 hdbsql을 사용하여 Inifile 내용을 확인하는 데 설명된 대로 감지할 수 있습니다.-
수정:
log_mode를 normal로 변경하고 주 데이터베이스를 다시 시작합니다.
CIB 항목:
detect: 클러스터 정보 베이스의 SFAIL 항목입니다.
CIB 항목을 찾아서 제거하려면 클러스터 일관성 확인을 참조하십시오.
cleanup/clear:
detect:
[root@clusternode1]# pcs status --full종종 오류 또는 경고를 표시합니다. 리소스를 정리/삭제할 수 있으며 모든 것이 정상이면 아무 일도 발생하지 않습니다. 다음 테스트를 실행하기 전에 환경을 정리할 수 있습니다.
수정할 예제:
[root@clusternode1]# pcs resource clear <name-of-the-clone-resource>[root@clusternode1]# pcs resource cleanup <name-of-the-clone-resource>
이 기능은 기존 환경에 문제가 있는지 확인하려는 경우에도 유용합니다.
자세한 내용은 Useful 명령을 참조하십시오.