3장. leader Worker Set Operator


3.1. leader Worker Set Operator 개요

AI/ML 유추에 대용량 언어 모델(LLM)을 사용하려면 종종 상당한 컴퓨팅 리소스가 필요하며 일반적으로 여러 노드에 워크로드를 분할해야 합니다. 이로 인해 배포가 복잡하고 스케일링에 대한 문제가 발생하며, 실패에서 복구하고, Pod 배치를 효율적으로 배치할 수 있습니다.

Leader Worker Set Operator는 Pod 그룹을 조정된 단일 단위로 처리하여 이러한 다중 노드 배포를 단순화합니다. 그룹에서 각 pod의 라이프사이클을 관리하고, 전체 그룹을 함께 스케일링하고, 그룹 수준에서 업데이트 및 실패 복구를 수행하여 일관성을 보장합니다.

3.1.1. Leader Worker Set Operator 정보

Leader Worker Set Operator는 LeaderWorkerSet 오픈 소스 프로젝트를 기반으로 합니다. LeaderWorkerSet 은 Pod 그룹을 단위로 배포하는 데 사용할 수 있는 사용자 지정 Kubernetes API입니다. 이는 대용량 언어 모델(LLM)이 여러 노드에 분할되는 AI(AI) 및 머신 러닝(ML) 추론 워크로드에 유용합니다.

LeaderWorkerSet API를 사용하면 Pod가 하나의 리더와 여러 작업자로 구성된 단위로 그룹화되며, 모두 단일 엔티티로 함께 관리됩니다. 그룹의 각 Pod에는 고유한 Pod ID가 있습니다. 그룹 내의 Pod는 병렬로 생성되고 동일한 라이프사이클 단계를 공유합니다. 롤아웃, 롤링 업데이트 및 Pod 실패 재시작은 그룹으로 수행됩니다.

LeaderWorkerSet 구성에서는 그룹 크기와 그룹 복제본 수를 정의합니다. 필요한 경우 리더 및 작업자 Pod에 대해 별도의 템플릿을 정의하여 역할별 사용자 지정을 수행할 수 있습니다. 동일한 그룹의 Pod가 동일한 토폴로지에 공동 배치되도록 토폴로지 인식 배치를 구성할 수도 있습니다.

중요

Leader Worker Set Operator를 설치하기 전에 서비스를 구성하고 메트릭 컬렉션을 관리하는 데 필요하므로 cert-manager Operator for Red Hat OpenShift를 설치해야 합니다.

Leader Worker Set Operator에 대한 모니터링은 기본적으로 Prometheus를 통해 OpenShift Container Platform과 함께 제공됩니다.

3.1.1.1. LeaderWorkerSet 아키텍처

다음 다이어그램에서는 LeaderWorkerSet API에서 하나의 Pod가 리더로, 나머지를 작업자로 조정하여 Pod 그룹을 단일 단위로 구성하는 방법을 보여줍니다.

그림 3.1. 리더 작업자 세트 아키텍처

LeaderWorkerSet API는 리더 상태 저장 세트를 사용하여 Pod 그룹의 배포 및 라이프사이클을 관리합니다. 정의된 각 복제본에 대해 leader-worker 그룹이 생성됩니다.

각 leader-worker 그룹에는 리더 Pod 및 작업자 상태 저장 세트가 포함되어 있습니다. worker stateful 세트는 리더 Pod에 의해 소유되며 해당 리더 Pod와 연결된 작업자 Pod 세트를 관리합니다. 지정된 크기는 리더 Pod가 해당 수에 포함된 각 leader-worker 그룹의 총 Pod 수를 정의합니다.

맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat