11.10. 고가용성 및 클러스터
잘못 대문자 target-role 값으로 인해 pcs 명령이 더 이상 실패하지 않음
이번 업데이트 이전에는 리소스의 target-role meta-attribute가 Stopped 대신 중지된 것과 같이 대문자로 설정된 값으로 설정된 경우pcs 가 클러스터 상태를 구문 분석하지 못했습니다. 이 구문 분석 오류로 인해 pcs status query 리소스 명령과 pcs resource delete 를 포함하여 리소스를 삭제하는 명령이 실패했습니다.
이번 업데이트를 통해 pcs 의 클러스터 상태 구문 분석 논리가 보다 유연해졌습니다.
결과적으로 리소스에 잘못된 대문자 값이 있는 target-role 메타 속성이 있는 경우에도 pcs 명령이 올바르게 작동합니다.
fence_ibm_powervs 는 일반 텍스트 토큰 파일 지원
이번 업데이트 이전에는 fence_ibm_powervs 에이전트가 JSON으로 포맷된 파일에서만 인증 토큰을 읽을 수 있었습니다. 일반 텍스트 파일에서 토큰을 읽지 못했습니다.
이번 업데이트를 통해 에이전트의 파일 읽기 논리가 수정되었습니다.
결과적으로 fence_ibm_powervs 에이전트는 JSON 또는 일반 텍스트 형식으로 된 토큰 파일을 사용할 수 있습니다.
Jira:RHEL-88569[1]
쿼럼이 손실되면 Pacemaker 원격 노드가 더 이상 펜싱되지 않음
이번 업데이트 이전에는 해당 노드를 관리하는 리소스가 다른 정족수 노드에서 안전하게 다시 시작할 수 있더라도 특정 클러스터 구성에서 파티션이 쿼럼이 손실될 때 Pacemaker 원격 노드를 펜싱할 수 있었습니다. 이 동작으로 인해 Pacemaker 원격 노드에서 실행되는 서비스에 불필요한 다운타임이 발생했습니다.
이번 업데이트를 통해 이 동작을 제어하기 위해 새로운 클러스터 속성인 fence-remote-without-quorum 이 도입되었습니다.
결과적으로 기본 fence-remote-without-quorum=false 설정을 사용하면 Pacemaker에서 원격 노드를 복구할 수 있는 경우 더 이상 원격 노드를 펜싱하지 않으므로 서비스 가용성이 향상됩니다.
Jira:RHEL-86146[1]
Pacemaker에서 더 이상 대규모 클러스터에 대한 수동 IPC 버퍼 튜닝이 필요하지 않음
이번 업데이트 이전에는 노드 또는 리소스가 많은 클러스터에서 Pacemaker의 내부 통신이 기본 버퍼 크기를 초과할 수 있었습니다. 이로 인해 로그된 오류가 발생하고 명령줄 도구가 느려지거나 응답하지 않을 수 있습니다. 사용자가 이러한 문제를 해결하기 위해 수동으로 PCMK_ipc_buffer 설정을 늘려야 하는 경우가 있었습니다.
이번 업데이트를 통해 Pacemaker의 IPC(프로세스 간 통신) 코드가 고정된 버퍼 제한 없이 대규모 메시지를 처리하도록 향상되었습니다.
결과적으로 PCMK_ipc_buffer 설정이 더 이상 필요하지 않으며 더 이상 사용되지 않습니다. 명령줄 툴은 복잡한 클러스터에서 더 신속하게 응답하며 버퍼 크기 오류가 더 이상 기록되지 않습니다.
Jira:RHEL-86144[1]
시작 시간 또는 중지 시간이 긴 systemd 리소스가 올바르게 처리됨
이번 업데이트 이전에는 Pacemaker에서 시작 결과를 폴링하고 systemd 리소스에 대한 작업을 중지했습니다. 이 시간 초과보다 리소스를 시작하거나 중지하는 데 시간이 오래 걸리는 경우 Pacemaker에서 리소스를 실패로 잘못 표시했습니다.
이번 업데이트를 통해 Pacemaker에서 시작 또는 중지 작업이 완료될 때 알림을 받을 systemd 에서 DBus 메시지를 수신 대기합니다.
결과적으로 Pacemaker에서 장기 실행 systemd 서비스의 상태를 올바르게 감지하고 시간 초과로 인해 리소스가 더 이상 실패로 표시되지 않습니다.
Jira:RHEL-71181[1]