3장. 리더 작업자 세트 운영자


3.1. 리더 워커 세트 운영자 개요

AI/ML 추론을 위해 대규모 언어 모델(LLM)을 사용하려면 상당한 컴퓨팅 리소스가 필요한 경우가 많으며, 일반적으로 작업 부하를 여러 노드에 분산해야 합니다. 이로 인해 배포가 복잡해지고 확장, 장애 복구, 효율적인 포드 배치와 관련된 문제가 발생할 수 있습니다.

리더 워커 세트 오퍼레이터는 포드 그룹을 하나의 조정된 단위로 처리하여 이러한 다중 노드 배포를 간소화합니다. 그룹 내 각 포드의 수명 주기를 관리하고, 전체 그룹을 확장하고, 일관성을 보장하기 위해 그룹 수준에서 업데이트와 장애 복구를 수행합니다.

3.1.1. 리더 워커 세트 연산자에 관하여

LeaderWorkerSet Operator는 LeaderWorkerSet 오픈 소스 프로젝트를 기반으로 합니다. LeaderWorkerSet 은 포드 그룹을 하나의 단위로 배포하는 데 사용할 수 있는 맞춤형 Kubernetes API입니다. 이 기능은 대규모 언어 모델(LLM)이 여러 노드에 분산되어 있는 인공 지능(AI) 및 머신 러닝(ML) 추론 워크로드에 유용합니다.

LeaderWorkerSet API를 사용하면 포드가 하나의 리더와 여러 워커로 구성된 단위로 그룹화되며, 모두 단일 엔터티로 함께 관리됩니다. 그룹 내의 각 포드는 고유한 포드 정체성을 갖습니다. 그룹 내의 포드는 병렬로 생성되며 동일한 수명 주기 단계를 공유합니다. 롤아웃, 롤링 업데이트, 포드 장애 재시작은 그룹으로 수행됩니다.

LeaderWorkerSet 구성에서는 그룹 크기와 그룹 복제본 수를 정의합니다. 필요한 경우 리더 및 작업자 포드에 대해 별도의 템플릿을 정의하여 역할별로 사용자 정의할 수 있습니다. 또한 토폴로지 인식 배치를 구성하여 동일 그룹의 포드가 동일한 토폴로지에 함께 배치되도록 할 수도 있습니다.

중요

Leader Worker Set Operator를 설치하기 전에 먼저 Red Hat OpenShift용 cert-manager Operator를 설치해야 합니다. 이는 서비스를 구성하고 메트릭 수집을 관리하는 데 필요하기 때문입니다.

OpenShift Container Platform에서는 Prometheus를 통해 Leader Worker Set Operator에 대한 모니터링이 기본적으로 제공됩니다.

3.1.1.1. LeaderWorkerSet 아키텍처

다음 다이어그램은 LeaderWorkerSet API가 어떻게 포드 그룹을 단일 단위로 구성하여 하나의 포드를 리더로, 나머지를 워커로 하여 분산된 작업 부하를 조정하는지 보여줍니다.

그림 3.1. 리더 워커 세트 아키텍처

LeaderWorkerSet API는 리더 상태 집합을 사용하여 포드 그룹의 배포 및 수명 주기를 관리합니다. 정의된 각 복제본에 대해 리더-워커 그룹이 생성됩니다.

각 리더-워커 그룹에는 리더 포드와 워커 상태 집합이 포함됩니다. 워커 상태 집합은 리더 포드가 소유하고 해당 리더 포드와 연관된 워커 포드 집합을 관리합니다. 지정된 크기는 각 리더-워커 그룹의 총 포드 수를 정의하며, 리더 포드도 해당 숫자에 포함됩니다.

맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat