7.10. 고가용성 및 클러스터
잘못 대문자 target-role 값으로 인해 pcs 명령이 더 이상 실패하지 않음
이번 업데이트 이전에는 리소스의 target-role meta-attribute가 Stopped 대신 중지된 것과 같이 대문자로 설정된 값으로 설정된 경우pcs 가 클러스터 상태를 구문 분석하지 못했습니다. 이 구문 분석 오류로 인해 pcs status query 리소스 명령과 pcs resource delete 를 포함하여 리소스를 삭제하는 명령이 실패했습니다.
이번 업데이트를 통해 pcs 의 클러스터 상태 구문 분석 논리가 보다 유연해졌습니다.
결과적으로 리소스에 잘못된 대문자 값이 있는 target-role 메타 속성이 있는 경우에도 pcs 명령이 올바르게 작동합니다.
fence_ibm_powervs 는 일반 텍스트 토큰 파일 지원
이번 업데이트 이전에는 fence_ibm_powervs 에이전트가 JSON으로 포맷된 파일에서만 인증 토큰을 읽을 수 있었습니다. 일반 텍스트 파일에서 토큰을 읽지 못했습니다.
이번 업데이트를 통해 에이전트의 파일 읽기 논리가 수정되었습니다.
결과적으로 fence_ibm_powervs 에이전트는 JSON 또는 일반 텍스트 형식으로 된 토큰 파일을 사용할 수 있습니다.
시작 시간 또는 중지 시간이 긴 systemd 리소스가 올바르게 처리됨
이번 업데이트 이전에는 Pacemaker에서 시작 결과를 폴링하고 systemd 리소스에 대한 작업을 중지했습니다. 이 시간 초과보다 리소스를 시작하거나 중지하는 데 시간이 오래 걸리는 경우 Pacemaker에서 리소스를 실패로 잘못 표시했습니다.
이번 업데이트를 통해 Pacemaker에서 시작 또는 중지 작업이 완료될 때 알림을 받을 systemd 에서 DBus 메시지를 수신 대기합니다.
결과적으로 Pacemaker에서 장기 실행 systemd 서비스의 상태를 올바르게 감지하고 시간 초과로 인해 리소스가 더 이상 실패로 표시되지 않습니다.
Jira:RHEL-86143[1]
쿼럼이 손실되면 Pacemaker 원격 노드가 더 이상 펜싱되지 않음
이번 업데이트 이전에는 해당 노드를 관리하는 리소스가 다른 정족수 노드에서 안전하게 다시 시작할 수 있더라도 특정 클러스터 구성에서 파티션이 쿼럼이 손실될 때 Pacemaker 원격 노드를 펜싱할 수 있었습니다. 이 동작으로 인해 Pacemaker 원격 노드에서 실행되는 서비스에 불필요한 다운타임이 발생했습니다.
이번 업데이트를 통해 이 동작을 제어하기 위해 새로운 클러스터 속성인 fence-remote-without-quorum 이 도입되었습니다.
결과적으로 fence-remote-without-quorum=false 설정(기본값은 true)을 구성하면 Pacemaker에서 관리 리소스를 정족 노드에서 복구할 수 있는 경우 원격 노드를 펜싱하지 않으므로 서비스 가용성이 향상됩니다.
Jira:RHEL-84018[1]
fence_kubevirt 의 전원을 즉시 끕니다.
이번 업데이트 이전에는 fence_kubevirt 에이전트가 노드의 정상 종료를 수행했습니다. 이로 인해 노드의 전원이 즉시 꺼지지 않았기 때문에 펜싱 프로세스에 지연이 발생했습니다.
이번 릴리스에서는 에이전트가 즉각적이고 비정상적인 종료를 요청하도록 수정되었습니다.
결과적으로 fence_kubevirt 에이전트를 사용하면 노드의 전원이 즉시 꺼집니다.
fence_sbd 가 개별 SBD 장치 장애에 더 탄력적으로 지원됨
이전에는 구성된 SBD 장치 중 하나 이상이 초기 검사에 실패한 경우 fence_sbd 에이전트가 종료되고 작업이 실패했습니다. 이로 인해 다른 SBD 장치가 정상인 경우에도 펜싱 작업이 완료되지 않았습니다.
이번 업데이트를 통해 에이전트의 오류 처리가 향상되었습니다.
결과적으로 fence_sbd 에이전트는 실패한 SBD 장치에 대한 오류를 기록하고 나머지 정상 장치를 사용하여 펜싱 작업을 계속합니다. 이로 인해 SBD 펜싱의 안정성이 증가했습니다.
Jira:RHEL-13088[1]