5.2.2.2. 하드 동시성 제한 구성
하드 동시성 제한은 엄격하게 적용된 상위 바인딩된 요청 제한입니다. 동시성이 하드 제한에 도달하면 초과된 요청이 버퍼링되며 요청을 실행하는 데 충분한 여유 용량이 있을 때까지 기다려야 합니다. containerConcurrency
사양을 수정하거나 kn service
명령을 올바른 플래그와 함께 사용하여 Knative 서비스의 하드 동시성 제한을 지정할 수 있습니다.
절차
선택 사항:
서비스
사용자 정의 리소스 사양에서 Knative 서비스의containerConcurrency
사양을 설정합니다.서비스 사양 예
apiVersion: serving.knative.dev/v1 kind: Service metadata: name: example-service namespace: default spec: template: spec: containerConcurrency: 50
기본값은
0
으로, 한 번에 하나의 서비스 복제본으로 이동할 수 있는 동시 요청 수에 제한이 없음을 의미합니다.0
보다 큰 값은 한 번에 하나의 서비스 복제본으로 이동할 수 있는 정확한 요청 수를 지정합니다. 이 예제에서는 하드 동시성 제한을 50개 요청으로 제한할 수 있습니다.선택 사항:
kn service
명령을 사용하여--concurrency-limit
플래그를 지정합니다.$ kn service create <service_name> --image <image_uri> --concurrency-limit <integer>
동시성 제한이 50개 요청인 서비스를 생성하는 명령의 예
$ kn service create example-service --image quay.io/openshift-knative/knative-eventing-sources-event-display:latest --concurrency-limit 50