2.2. 스케일링 경계
스케일 바인딩에는 언제든지 애플리케이션을 제공할 수 있는 최소 및 최대 복제본 수가 결정됩니다. 콜드 스타트를 방지하거나 컴퓨팅 비용을 제어하는 데 도움이 되는 애플리케이션의 규모 범위를 설정할 수 있습니다.
2.2.1. 최소 스케일링 범위
애플리케이션을 제공할 수 있는 최소 복제본 수는 min-scale
주석에 따라 결정됩니다. scale to 0이 활성화되지 않은 경우 min-scale
값은 기본적으로 1
입니다.
다음 조건이 충족되는 경우 min-scale
값은 기본적으로 복제본이 0
으로 설정됩니다.
-
min-scale
주석이 설정되어 있지 않음 - 0으로 스케일링 활성화
-
KPA
클래스 사용
min-scale
주석이 있는 서비스 사양의 예
apiVersion: serving.knative.dev/v1 kind: Service metadata: name: example-service namespace: default spec: template: metadata: annotations: autoscaling.knative.dev/min-scale: "0" ...
2.2.1.1. Knative CLI를 사용하여 min-scale 주석 설정
Knative(kn
) CLI를 사용하여 min-scale
주석을 설정하면 YAML 파일을 직접 수정하는 것보다 더 간소화되고 직관적인 사용자 인터페이스가 제공됩니다. kn service
명령을 --scale-min
플래그와 함께 사용하여 서비스의 min-scale
값을 생성하거나 수정할 수 있습니다.
사전 요구 사항
- Knative Serving이 클러스터에 설치되어 있습니다.
-
Knative(
kn
) CLI가 설치되어 있습니다.
절차
--scale-min
플래그를 사용하여 서비스의 최소 복제본 수를 설정합니다.$ kn service create <service_name> --image <image_uri> --scale-min <integer>
명령 예
$ kn service create example-service --image quay.io/openshift-knative/knative-eventing-sources-event-display:latest --scale-min 2
2.2.2. 최대 스케일링 경계
애플리케이션을 제공할 수 있는 최대 복제본 수는 max-scale
주석에 따라 결정됩니다. max-scale
주석을 설정하지 않으면 생성된 복제본 수에 대한 상한이 없습니다.
max-scale
주석이 있는 서비스 사양의 예
apiVersion: serving.knative.dev/v1 kind: Service metadata: name: example-service namespace: default spec: template: metadata: annotations: autoscaling.knative.dev/max-scale: "10" ...
2.2.2.1. Knative CLI를 사용하여 max-scale 주석 설정
Knative(kn
) CLI를 사용하여 max-scale
주석을 설정하면 YAML 파일을 직접 수정하는 것보다 더 간소화되고 직관적인 사용자 인터페이스가 제공됩니다. kn service
명령을 --scale-max
플래그와 함께 사용하여 서비스의 max-scale
값을 생성하거나 수정할 수 있습니다.
사전 요구 사항
- Knative Serving이 클러스터에 설치되어 있습니다.
-
Knative(
kn
) CLI가 설치되어 있습니다.
절차
--scale-max
플래그를 사용하여 서비스의 최대 복제본 수를 설정합니다.$ kn service create <service_name> --image <image_uri> --scale-max <integer>
명령 예
$ kn service create example-service --image quay.io/openshift-knative/knative-eventing-sources-event-display:latest --scale-max 10