16장. 클러스터 노드에 대한 짧은 대기 시간 튜닝 이해
엣지 컴퓨팅은 대기 시간 및 혼잡 문제를 줄이고 통신 및 5G 네트워크 애플리케이션의 애플리케이션 성능을 개선하는 데 중요한 역할을 합니다. 5G의 네트워크 성능 요구 사항을 충족하기 위해서는 대기 시간이 가장 낮은 네트워크 아키텍처를 유지하는 것이 중요합니다. 4G 기술에 비해 평균 대기 시간은 50ms이고 5G는 1ms 이하의 대기 시간에 도달할 수 있습니다. 이렇게 대기 시간이 감소하면 무선 처리량이 10배 증가합니다.
16.1. 낮은 지연 시간에 관하여 링크 복사링크가 클립보드에 복사되었습니다!
Telco 공간에 배포된 많은 애플리케이션에서는 제로 패킷 손실이 가능한 짧은 대기 시간을 요구하고 있습니다. 제로 패킷 손실 튜닝은 네트워크 성능을 저하시키는 고유한 문제를 완화하는 데 도움이 됩니다. 자세한 내용은 Red Hat OpenStack Platform(RHOSP)에서 패킷 손실 없이 튜닝하기(Tuning for Zero Packet Loss)를 참조하세요.
Edge 컴퓨팅 이니셔티브는 대기 시간을 줄이는 데에도 큰 역할을 합니다. 클라우드의 가장자리에 있고 사용자에게 더 가깝다고 생각해 보세요. 이렇게 되면 멀리 있는 데이터 센터와 사용자 간 거리를 크게 줄여 애플리케이션 응답 시간과 성능 대기 시간이 단축됩니다.
관리자는 많은 엣지 사이트와 로컬 서비스를 중앙 집중식으로 관리하여 가능한 한 가장 낮은 관리 비용으로 모든 배포를 실행할 수 있어야 합니다. 또한, 실시간 짧은 대기 시간과 높은 성능을 실현할 수 있도록 클러스터의 특정 노드를 쉽게 배포하고 구성할 수 있어야 합니다. 대기 시간이 짧은 노드는 CNF(클라우드 네이티브 네트워크 기능) 및 DPDK(데이터 플레인 개발 키트)와 같은 애플리케이션에 유용합니다.
OpenShift Container Platform에서는 현재 실시간 실행과 짧은 대기 시간(약 20마이크로초 미만의 반응 시간)을 지원하기 위해 OpenShift Container Platform 클러스터의 소프트웨어를 튜닝하는 메커니즘을 제공합니다. 이 메커니즘에는 커널 및 OpenShift Container Platform 설정 값 튜닝, 커널 설치, 머신 재구성이 포함되어 있습니다. 하지만 이 방법을 사용하려면 4가지 Operator를 설정해야 하며 수동으로 수행할 경우 복잡하고 실수하기 쉬운 많은 구성을 수행해야 합니다.
OpenShift Container Platform은 Node Tuning Operator를 사용하여 자동 튜닝을 구현하여 OpenShift Container Platform 애플리케이션의 저지연 성능을 달성합니다. 클러스터 관리자는 이 성능 프로필 구성을 사용하여 보다 안정적인 방식으로 이러한 변경을 더욱 쉽게 수행할 수 있습니다. 관리자는 커널을 kernel-rt로 업데이트할지 여부를 지정하고, Pod 인프라 컨테이너를 포함하여 클러스터 및 운영 체제 하우스키핑 작업을 위해 CPU를 예약하고, 애플리케이션 컨테이너의 CPU를 분리하여 워크로드를 실행할 수 있습니다.
OpenShift Container Platform은 또한 다양한 산업 환경의 요구 사항을 충족하도록 PerformanceProfile을
조정할 수 있는 노드 튜닝 운영자에 대한 워크로드 힌트를 지원합니다. highPowerConsumption
(전력 소비 증가를 감수하고 대기 시간이 매우 낮음) 및 realTime
(최적의 대기 시간에 우선순위 부여)에 대한 작업 부하 힌트를 사용할 수 있습니다. 이러한 힌트에 대한 참/거짓
설정을 조합하여 애플리케이션별 작업 프로필과 요구 사항을 처리할 수 있습니다.
워크로드 힌트를 통해 산업 부문 설정에 맞춰 성능을 미세하게 조정할 수 있습니다. "모든 사람에게 맞는 단일 크기" 접근 방식 대신 작업 힌트는 다음과 같은 우선 순위를 지정하는 등 사용 패턴에 맞춰 조정될 수 있습니다.
- 낮은 지연 시간
- 실시간 기능
- 전력의 효율적인 사용
이상적으로 이전에 나열된 모든 항목의 우선 순위가 지정됩니다. 하지만 이러한 품목 중 일부는 다른 품목을 희생해서 얻어집니다. 이제 노드 튜닝 운영자는 작업 부하에 대한 기대치를 알고 작업 부하 요구 사항을 더 잘 충족할 수 있습니다. 이제 클러스터 관리자는 해당 작업 부하가 어떤 사용 사례에 속하는지 지정할 수 있습니다. 노드 튜닝 연산자는 PerformanceProfile을
사용하여 작업 부하에 대한 성능 설정을 미세 조정합니다.
애플리케이션이 작동하는 환경은 애플리케이션의 동작에 영향을 미칩니다. 엄격한 대기 시간 요구 사항이 없는 일반적인 데이터 센터의 경우 일부 고성능 워크로드 포드에 대한 CPU 파티셔닝을 활성화하는 최소한의 기본 튜닝만 필요합니다. 지연 시간이 더 높은 우선순위인 데이터 센터와 작업 부하의 경우에도 전력 소비를 최적화하기 위한 조치가 취해집니다. 가장 복잡한 경우는 제조 장비나 소프트웨어 정의 무선 장치와 같이 지연 시간에 민감한 장비에 가까운 클러스터입니다. 이 마지막 배포 유형은 종종 Far edge라고 합니다. Far edge 배포의 경우, 매우 낮은 지연 시간이 최우선 순위이며, 이는 전력 관리를 희생하여 달성됩니다.