3.9. hdbindexserver 프로세스 실패 작업에 SAP HANA srServiceStateChanged() 후크 활성화 (선택 사항)


HANA가 indexserver 프로세스의 문제를 감지하면 SAP HANA에 내장된 내장 기능을 통해 자동으로 중지하고 다시 시작하여 이를 복구합니다.

그러나 경우에 따라 "중지"단계에 매우 오랜 시간이 걸릴 수 있습니다. 이 기간 동안 HANA는 계속 작동하고 새 연결을 수락하는 동안 시스템 복제가 동기화되지 않을 수 있습니다. 결국 서비스는 stop-and-restart 프로세스를 완료하고 복구합니다.

데이터 일관성에 위험을 초래하는 이 장기적인 재시작을 기다리는 대신, 해당 시간 동안 인스턴스에서 다른 문제가 발생할 경우 ChkSrv.py 후크 스크립트는 상황에 반응하고 더 빠른 복구를 위해 HANA 인스턴스를 중지할 수 있습니다. 자동 장애 조치가 활성화된 설정에서는 보조 노드가 정상 상태인 경우 인스턴스 중지가 시작됩니다. 그렇지 않으면 복구가 로컬로 계속되지만 강제 인스턴스를 다시 시작하면 속도가 빨라집니다.

global.ini 구성 파일에서 구성된 경우 SAP HANA는 인스턴스의 모든 이벤트에 대해 ChkSrv.py 후크 스크립트를 호출합니다. 이 스크립트는 이벤트를 처리하고 이벤트 세부 정보에 적용되는 필터 결과에 따라 작업을 실행합니다. 이렇게 하면 인스턴스 종료의 일부로 오류가 발생한 후 HANA에서 중지하고 다시 시작하는 HANA 인덱스 서버 프로세스를 구분할 수 있습니다.

다음은 수행할 수 있는 다양한 동작입니다.

  • 무시: 이 작업은 구문 분석된 이벤트 및 의사 결정 정보를 전용 로그 파일에 쓰기만 하면 후크 스크립트가 수행할 작업을 확인하는 데 유용합니다.
  • stop: 이 작업은 sapcontrol 명령을 통해 인스턴스에 대해 정상 stopSystem 을 실행합니다.
  • kill: 이 작업은 구성할 수 있는 기본 신호 9를 사용하여HDB kill- <signal> 명령을 실행합니다.

중지 및 종료 작업은 모두 중지된 HANA 인스턴스로 이어지며 종료 작업은 결국 약간 더 빨라집니다.

이 시점에서 클러스터는 HANA 리소스의 실패를 확인하고 구성 방식으로 대응합니다. 일반적으로 인스턴스를 재시작하고 활성화하면 이 리소스도 처리합니다.

3.9.1. resource-agents-sap-hana 패키지 버전 확인

Pacemaker 클러스터에 설명된 대로 RHEL 9 버전에 대해 srServiceStateChanged() 후크를 활성화하는 데 필요한 구성 요소를 제공하는 resource-agents-sap-hana 패키지의 올바른 버전이 HANA 시스템 복제에 설명된 대로 기본 HANA 인스턴스 중단/크래시의 hdbindexserver 프로세스를 트리거하지 않는지 확인하십시오.

3.9.2. 모든 SAP HANA 인스턴스에서 srServiceStateChanged() 후크 활성화

참고

모든 HA 클러스터 노드의 각 SAP HANA 인스턴스에 대해 srServiceStateChanged() 후크를 활성화하는 단계를 수행해야 합니다.

  1. 각 노드에서 SAP HANA global.ini 파일을 업데이트하여 두 SAP HANA 인스턴스에서 후크 스크립트를 사용할 수 있도록 합니다(예: /hana/shared/RH1/global/hdb/custom/config/global.ini).

    [ha_dr_provider_chksrv]
    provider = ChkSrv
    path = /usr/share/SAPHanaSR/srHook
    execution_order = 2
    action_on_lost = stop
    
    [trace]
    ha_dr_saphanasr = info
    ha_dr_chksrv = info

    다음과 같이 선택적 매개변수를 설정합니다.

    • action_on_lost (기본값: ignore)
    • stop_timeout (기본값: 20)
    • kill_signal (기본값: 9)

    다음은 action_on_lost 에 사용 가능한 옵션에 대한 설명입니다.

    • ignore: 기능을 활성화하지만 이벤트만 기록합니다. 이는 구성된 환경에서 후크의 활동을 모니터링하는 데 유용합니다.
    • stop: 이 명령은 정상 sapcontrol -nr <nr> -function StopSystem 을 실행합니다.
    • kill: 가장 빠른 정지를 위해HDB kill-<signal >을 실행합니다.
    • stop_timeout 은 stop 및 kill 작업의 명령에 추가되며 kill_signal 은HDB kill -<signal> 명령의 일부로 kill 작업에 사용됩니다.
  2. HA/DR 공급자를 다시 로드하여 HANA가 실행되는 동안 새 후크를 활성화합니다.

    [rh1adm]$ hdbnsutil -reloadHADRProviders
  3. 새 추적 파일을 확인하여 후크 초기화를 확인합니다.

    [rh1adm]$ cdtrace
    [rh1adm]$ cat nameserver_chksrv.trc
Red Hat logoGithubRedditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

© 2024 Red Hat, Inc.