클러스터 관리
OpenShift Container Platform 3.11 클러스터 관리
초록
1장. 개요
이러한 클러스터 관리 주제에서는 OpenShift Container Platform 클러스터 및 기타 고급 구성 주제를 관리하기 위한 일상적인 작업을 다룹니다.
2장. 노드 관리
2.1. 개요
CLI 를 사용하여 인스턴스의 노드를 관리할 수 있습니다.
노드 관리 작업을 수행할 때 CLI는 실제 노드 호스트를 나타내는 노드 오브젝트 와 상호 작용합니다. 마스터는 노드 오브젝트의 정보를 사용하여 상태 점검 으로 노드를 검증합니다.
2.2. 노드 나열
마스터에 알려진 모든 노드를 나열하려면 다음을 수행합니다.
$ oc get nodes
출력 예
NAME STATUS ROLES AGE VERSION master.example.com Ready master 7h v1.9.1+a0ce1bc657 node1.example.com Ready compute 7h v1.9.1+a0ce1bc657 node2.example.com Ready compute 7h v1.9.1+a0ce1bc657
노드 정보를 사용하여 프로젝트의 Pod 배포에 대한 정보가 있는 모든 노드를 나열하려면 다음을 수행합니다.
$ oc get nodes -o wide
출력 예
NAME STATUS ROLES AGE VERSION EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME ip-172-18-0-39.ec2.internal Ready infra 1d v1.10.0+b81c8f8 54.172.185.130 Red Hat Enterprise Linux Server 7.5 (Maipo) 3.10.0-862.el7.x86_64 docker://1.13.1 ip-172-18-10-95.ec2.internal Ready master 1d v1.10.0+b81c8f8 54.88.22.81 Red Hat Enterprise Linux Server 7.5 (Maipo) 3.10.0-862.el7.x86_64 docker://1.13.1 ip-172-18-8-35.ec2.internal Ready compute 1d v1.10.0+b81c8f8 34.230.50.57 Red Hat Enterprise Linux Server 7.5 (Maipo) 3.10.0-862.el7.x86_64 docker://1.13.1
단일 노드에 대한 정보만 나열하려면 <node>
를 전체 노드 이름으로 교체합니다.
$ oc get node <node>
이러한 명령 출력의 STATUS
열에 다음과 같은 상태의 노드가 표시될 수 있습니다.
상태 | 설명 |
---|---|
|
노드는 |
| 노드는 마스터에서 수행한 상태 점검을 전달하지 않습니다. |
| Pod는 노드에 배치하도록 예약할 수 없습니다. |
CLI가 노드 조건을 찾을 수 없는 경우 STATUS
열에 노드에 대해 Unknown
을 표시할 수도 있습니다.
현재 조건의 이유를 포함하여 특정 노드에 대한 자세한 정보를 얻으려면 다음을 수행합니다.
$ oc describe node <node>
예를 들면 다음과 같습니다.
$ oc describe node node1.example.com
출력 예
Name: node1.example.com 1 Roles: compute 2 Labels: beta.kubernetes.io/arch=amd64 3 beta.kubernetes.io/os=linux kubernetes.io/hostname=m01.example.com node-role.kubernetes.io/compute=true node-role.kubernetes.io/infra=true node-role.kubernetes.io/master=true zone=default Annotations: volumes.kubernetes.io/controller-managed-attach-detach=true 4 CreationTimestamp: Thu, 24 May 2018 11:46:56 -0400 Taints: <none> 5 Unschedulable: false Conditions: 6 Type Status LastHeartbeatTime LastTransitionTime Reason Message ---- ------ ----------------- ------------------ ------ ------- OutOfDisk False Tue, 17 Jul 2018 11:47:30 -0400 Tue, 10 Jul 2018 15:45:16 -0400 KubeletHasSufficientDisk kubelet has sufficient disk space available MemoryPressure False Tue, 17 Jul 2018 11:47:30 -0400 Tue, 10 Jul 2018 15:45:16 -0400 KubeletHasSufficientMemory kubelet has sufficient memory available DiskPressure False Tue, 17 Jul 2018 11:47:30 -0400 Tue, 10 Jul 2018 16:03:54 -0400 KubeletHasNoDiskPressure kubelet has no disk pressure Ready True Tue, 17 Jul 2018 11:47:30 -0400 Mon, 16 Jul 2018 15:10:25 -0400 KubeletReady kubelet is posting ready status PIDPressure False Tue, 17 Jul 2018 11:47:30 -0400 Thu, 05 Jul 2018 10:06:51 -0400 KubeletHasSufficientPID kubelet has sufficient PID available Addresses: 7 InternalIP: 192.168.122.248 Hostname: node1.example.com Capacity: 8 cpu: 2 hugepages-2Mi: 0 memory: 8010336Ki pods: 40 Allocatable: cpu: 2 hugepages-2Mi: 0 memory: 7907936Ki pods: 40 System Info: 9 Machine ID: b3adb9acbc49fc1f9a7d6 System UUID: B3ADB9A-B0CB-C49FC1F9A7D6 Boot ID: 9359d15aec9-81a20aef5876 Kernel Version: 3.10.0-693.21.1.el7.x86_64 OS Image: OpenShift Enterprise Operating System: linux Architecture: amd64 Container Runtime Version: docker://1.13.1 Kubelet Version: v1.10.0+b81c8f8 Kube-Proxy Version: v1.10.0+b81c8f8 ExternalID: node1.example.com Non-terminated Pods: (14 in total) 10 Namespace Name CPU Requests CPU Limits Memory Requests Memory Limits --------- ---- ------------ ---------- --------------- ------------- default docker-registry-2-w252l 100m (5%) 0 (0%) 256Mi (3%) 0 (0%) default registry-console-2-dpnc9 0 (0%) 0 (0%) 0 (0%) 0 (0%) default router-2-5snb2 100m (5%) 0 (0%) 256Mi (3%) 0 (0%) kube-service-catalog apiserver-jh6gt 0 (0%) 0 (0%) 0 (0%) 0 (0%) kube-service-catalog controller-manager-z4t5j 0 (0%) 0 (0%) 0 (0%) 0 (0%) kube-system master-api-m01.example.com 0 (0%) 0 (0%) 0 (0%) 0 (0%) kube-system master-controllers-m01.example.com 0 (0%) 0 (0%) 0 (0%) 0 (0%) kube-system master-etcd-m01.example.com 0 (0%) 0 (0%) 0 (0%) 0 (0%) openshift-ansible-service-broker asb-1-hnn5t 0 (0%) 0 (0%) 0 (0%) 0 (0%) openshift-node sync-dvhvs 0 (0%) 0 (0%) 0 (0%) 0 (0%) openshift-sdn ovs-zjs5k 100m (5%) 200m (10%) 300Mi (3%) 400Mi (5%) openshift-sdn sdn-zr4cb 100m (5%) 0 (0%) 200Mi (2%) 0 (0%) openshift-template-service-broker apiserver-s9n7t 0 (0%) 0 (0%) 0 (0%) 0 (0%) openshift-web-console webconsole-785689b664-q7s9j 100m (5%) 0 (0%) 100Mi (1%) 0 (0%) Allocated resources: (Total limits may be over 100 percent, i.e., overcommitted.) CPU Requests CPU Limits Memory Requests Memory Limits ------------ ---------- --------------- ------------- 500m (25%) 200m (10%) 1112Mi (14%) 400Mi (5%) Events: 11 Type Reason Age From Message ---- ------ ---- ---- ------- Normal NodeHasSufficientPID 6d (x5 over 6d) kubelet, m01.example.com Node m01.example.com status is now: NodeHasSufficientPID Normal NodeAllocatableEnforced 6d kubelet, m01.example.com Updated Node Allocatable limit across pods Normal NodeHasSufficientMemory 6d (x6 over 6d) kubelet, m01.example.com Node m01.example.com status is now: NodeHasSufficientMemory Normal NodeHasNoDiskPressure 6d (x6 over 6d) kubelet, m01.example.com Node m01.example.com status is now: NodeHasNoDiskPressure Normal NodeHasSufficientDisk 6d (x6 over 6d) kubelet, m01.example.com Node m01.example.com status is now: NodeHasSufficientDisk Normal NodeHasSufficientPID 6d kubelet, m01.example.com Node m01.example.com status is now: NodeHasSufficientPID Normal Starting 6d kubelet, m01.example.com Starting kubelet. ...
2.3. 노드 보기
컨테이너에 런타임 환경을 제공하는 노드에 대한 사용량 통계를 표시할 수 있습니다. 이러한 사용량 통계에는 CPU, 메모리, 스토리지 사용량이 포함됩니다.
사용량 통계를 보려면 다음을 수행합니다.
$ oc adm top nodes
출력 예
NAME CPU(cores) CPU% MEMORY(bytes) MEMORY% node-1 297m 29% 4263Mi 55% node-0 55m 5% 1201Mi 15% infra-1 85m 8% 1319Mi 17% infra-0 182m 18% 2524Mi 32% master-0 178m 8% 2584Mi 16%
라벨을 사용하여 노드의 사용량 통계를 보려면 다음을 실행합니다.
$ oc adm top node --selector=''
필터링할 선택기(라벨 쿼리)를 선택해야 합니다. =
, ==
, !=
가 지원됩니다.
사용량 통계를 보려면 cluster-reader
권한이 있어야 합니다.
사용량 통계를 보려면 metrics-server
를 설치해야 합니다. Horizontal Pod Autoscaler 사용에 대한 요구 사항을 참조하십시오.
2.4. 호스트 추가
scaleup.yml 플레이북을 실행하여 클러스터에 새 호스트를 추가할 수 있습니다. 이 플레이북은 마스터를 쿼리하고 새 호스트에 대한 새 인증서를 생성 및 배포한 다음 새 호스트에서만 구성 플레이북을 실행합니다. scaleup.yml 플레이북을 실행하기 전에 사전 요구 사항 호스트 준비 단계를 모두 완료합니다.
scaleup.yml 플레이북은 새 호스트만 구성합니다. 마스터 서비스에서 NO_PROXY 를 업데이트하지 않으며 마스터 서비스를 다시 시작하지 않습니다.
scaleup.yml 플레이북을 실행하려면 현재 클러스터 구성을 나타내는 기존 인벤토리 파일(예: /etc/ansible/hosts )이 있어야 합니다. 이전에 atomic-openshift-installer
명령을 사용하여 설치를 실행하는 경우 설치 프로그램에서 생성한 마지막 인벤토리 파일의 ~/.config/openshift/hosts 를 확인하고 해당 파일을 인벤토리 파일로 사용할 수 있습니다. 필요에 따라 이 파일을 수정할 수 있습니다. 그런 다음 ansible-playbook
을 실행할 때 -i
를 사용하여 파일 위치를 지정해야 합니다.
권장되는 최대 노드 수는 클러스터 최대값 섹션을 참조하십시오.
절차
openshift-ansible 패키지를 업데이트하여 최신 플레이북이 있는지 확인합니다.
# yum update openshift-ansible
/etc/ansible/hosts 파일을 편집하고 new_<host_type> 을 [OSEv3:children] 섹션에 추가합니다. 예를 들어 새 노드 호스트를 추가하려면 new_nodes 를 추가합니다.
[OSEv3:children] masters nodes new_nodes
새 마스터 호스트를 추가하려면 new_masters 를 추가합니다.
[new_<host_type>] 섹션을 생성하여 새 호스트에 대한 호스트 정보를 지정합니다. 새 노드 추가의 다음 예에 표시된 대로 이 섹션을 기존 섹션처럼 포맷합니다.
[nodes] master[1:3].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes] node3.example.com openshift_node_group_name='node-config-infra'
자세한 옵션은 호스트 변수 구성을 참조하십시오.
새 마스터 호스트를 추가할 때 [new_masters] 섹션과 [new_nodes] 섹션 모두에 호스트를 추가하여 새 마스터 호스트가 OpenShift SDN의 일부인지 확인합니다.
[masters] master[1:2].example.com [new_masters] master3.example.com [nodes] master[1:2].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes] master3.example.com
중요node-role.kubernetes.io/infra=true
레이블을 사용하여 마스터 호스트에 레이블을 지정하고 다른 전용 인프라 노드가 없는 경우, 항목에openshift_schedulable=true
를 추가하여 호스트를 예약 가능으로 명시적으로 표시해야 합니다. 그렇지 않으면 레지스트리 및 라우터 포드를 아무 위치에 배치할 수 없습니다.플레이북 디렉터리로 변경하고 openshift_node_group.yml 플레이북을 실행합니다. 인벤토리 파일이 기본값 /etc/ansible/hosts 이외의 위치에 있는 경우
-i
옵션을 사용하여 위치를 지정합니다.$ cd /usr/share/ansible/openshift-ansible $ ansible-playbook [-i /path/to/file] \ playbooks/openshift-master/openshift_node_group.yml
이렇게 하면 새 노드 그룹에 대한 ConfigMap이 생성되고 궁극적으로 호스트에서 노드의 구성 파일이 생성됩니다.
참고openshift_node_group.yaml 플레이북을 실행하면 새 노드만 업데이트됩니다. 클러스터의 기존 노드를 업데이트하기 위해 실행할 수 없습니다.
scaleup.yml 플레이북을 실행합니다. 인벤토리 파일이 기본값 /etc/ansible/hosts 이외의 위치에 있는 경우
-i
옵션을 사용하여 위치를 지정합니다.추가 노드의 경우 다음을 수행합니다.
$ ansible-playbook [-i /path/to/file] \ playbooks/openshift-node/scaleup.yml
추가 마스터의 경우 다음을 수행합니다.
$ ansible-playbook [-i /path/to/file] \ playbooks/openshift-master/scaleup.yml
클러스터에 EFK 스택을 배포한 경우 node 레이블을
logging-infra-fluentd=true
로 설정합니다.# oc label node/new-node.example.com logging-infra-fluentd=true
- 플레이북이 실행된 후 설치를 확인합니다.
[new_<host_type>] 섹션에서 정의한 호스트를 적절한 섹션으로 이동합니다. 이러한 호스트를 이동하면 이 인벤토리 파일을 사용하는 후속 플레이북 실행에서 노드를 올바르게 처리합니다. [new_<host_type>] 섹션은 비어 있습니다. 예를 들어 새 노드를 추가할 때 다음을 수행합니다.
[nodes] master[1:3].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' node3.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes]
2.5. 노드 삭제
CLI를 사용하여 노드를 삭제하면 Kubernetes에서 노드 오브젝트가 삭제되지만 노드 자체에 존재하는 Pod는 삭제되지 않습니다. 복제 컨트롤러에서 지원하지 않는 베어 Pod는 OpenShift Container Platform에 액세스할 수 없으며 복제 컨트롤러에서 지원하는 Pod는 다른 사용 가능한 노드로 다시 예약되며 로컬 매니페스트 Pod 는 수동으로 삭제해야 합니다.
OpenShift Container Platform 클러스터에서 노드를 삭제하려면 다음을 수행합니다.
- 삭제 를 준비 중인 노드에서 Pod 를 비웁니다.
노드 오브젝트를 삭제합니다.
$ oc delete node <node>
노드가 노드 목록에서 제거되었는지 확인합니다.
$ oc get nodes
이제 Pod가 Ready 상태인 나머지 노드에만 예약되어야 합니다.
- 모든 Pod 및 컨테이너를 포함하여 노드 호스트에서 모든 OpenShift Container Platform 콘텐츠를 제거하려면 노드 제거를 계속하고 uninstall.yml 플레이북을 사용하는 절차를 따르십시오. 이 절차에서는 Ansible을 사용하여 클러스터 설치 프로세스에 대한 일반적인 이해라고 가정합니다.
2.6. 노드에서 라벨 업데이트
노드에 라벨을 추가하거나 업데이트하려면 다음을 수행합니다.
$ oc label node <node> <key_1>=<value_1> ... <key_n>=<value_n>
자세한 사용법을 보려면 다음을 수행합니다.
$ oc label -h
2.7. 노드의 Pod 나열
하나 이상의 노드에 있는 모든 Pod 또는 선택한 Pod를 나열하려면 다음을 수행합니다.
$ oc adm manage-node <node1> <node2> \ --list-pods [--pod-selector=<pod_selector>] [-o json|yaml]
선택한 노드에서 모든 Pod 또는 선택한 Pod를 나열하려면 다음을 수행합니다.
$ oc adm manage-node --selector=<node_selector> \ --list-pods [--pod-selector=<pod_selector>] [-o json|yaml]
2.8. 노드를 예약 불가능 또는 예약 가능으로 표시
기본적으로 상태가 Ready
인 정상 노드는 예약 가능으로 표시됩니다. 즉, 노드에 새 Pod를 배치할 수 있습니다. 수동으로 노드를 예약 불가로 표시하면 새 Pod가 노드에 예약되지 않도록 차단됩니다. 노드의 기존 Pod에는 영향을 미치지 않습니다.
노드 또는 노드를 예약 불가로 표시하려면 다음을 수행합니다.
$ oc adm manage-node <node1> <node2> --schedulable=false
예를 들면 다음과 같습니다.
$ oc adm manage-node node1.example.com --schedulable=false
출력 예
NAME LABELS STATUS node1.example.com kubernetes.io/hostname=node1.example.com Ready,SchedulingDisabled
현재 예약할 수 없는 노드 또는 노드를 예약 가능으로 표시하려면 다음을 수행합니다.
$ oc adm manage-node <node1> <node2> --schedulable
또는 특정 노드 이름(예: <node1> <node2>)을 지정하는 대신
옵션을 사용하여 선택한 노드를 예약 가능 또는 예약 불가로 표시할 수 있습니다.
--selector=<
node_selector>
2.9. 노드에서 Pod 비우기
Pod를 비우면 지정된 노드에서 모든 Pod 또는 선택한 Pod를 마이그레이션할 수 있습니다. Pod 비우기를 수행하려면 먼저 노드를 예약할 수 없음으로 표시되어야 합니다.
복제 컨트롤러에서 지원하는 포드만 비울 수 있습니다. 복제 컨트롤러는 다른 노드에 새 포드를 생성하고 지정된 노드에서 기존 포드를 제거합니다. 복제 컨트롤러에서 지원하지 않는 베어 Pod는 기본적으로 영향을 받지 않습니다. Pod 선택기를 지정하여 Pod의 하위 집합을 비울 수 있습니다. 포드 선택기는 라벨을 기반으로 하므로 지정된 레이블이 있는 모든 Pod가 비어 있습니다.
노드에서 모든 Pod 또는 선택한 Pod를 비우려면 다음을 수행합니다.
$ oc adm drain <node> [--pod-selector=<pod_selector>]
--force
옵션을 사용하여 베어 Pod를 강제로 삭제할 수 있습니다. true
로 설정하면 복제 컨트롤러, ReplicaSet, 작업, daemonset 또는 StatefulSet에서 관리하지 않는 Pod가 있는 경우에도 삭제가 계속됩니다.
$ oc adm drain <node> --force=true
--grace-period
를 사용하여 각 포드가 정상적으로 종료될 수 있는 기간(초)을 설정할 수 있습니다. 음수인 경우 Pod에 지정된 기본값이 사용됩니다.
$ oc adm drain <node> --grace-period=-1
--ignore-daemonsets를 사용하여 daemonset-
managed Pod를 무시하도록 true
로 설정할 수 있습니다.
$ oc adm drain <node> --ignore-daemonsets=true
--timeout
을 사용하여 포기하기 전에 대기하는 시간을 설정할 수 있습니다. 값이 0
이면 시간이 제한되지 않습니다.
$ oc adm drain <node> --timeout=5s
emptyDir(노드 드레이닝 시 삭제되는 로컬 데이터)을 사용하는 Pod가 있는 경우에도 --delete-local-data
를 사용하여 삭제를 계속하도록 true
로 설정할 수 있습니다.
$ oc adm drain <node> --delete-local-data=true
실제로 비우기를 수행하지 않고 마이그레이션할 오브젝트를 나열하려면 --dry-run
옵션을 사용하여 true
로 설정합니다.
$ oc adm drain <node> --dry-run=true
특정 노드 이름을 지정하는 대신 --selector=<node_selector>
옵션을 사용하여 선택기와 일치하는 노드에서 Pod를 비울 수 있습니다.
2.10. 노드 재부팅
플랫폼에서 실행 중인 애플리케이션을 중단하지 않고 노드를 재부팅하려면 먼저 포드를 비우는 것이 중요합니다. 라우팅 계층에서 가용성이 높은 Pod의 경우 다른 작업을 수행할 필요가 없습니다. 스토리지(일반적으로 데이터베이스)가 필요한 기타 Pod의 경우 특정 Pod가 일시적으로 오프라인으로 전환된 상태에서도 계속 작동하는지 확인하는 것이 중요합니다. 상태 저장 Pod에 대한 복원력을 구현하는 것은 애플리케이션마다 다르지만, 모든 경우에 노드 유사성 방지를 사용하도록 스케줄러를 구성하여 Pod가 사용 가능한 노드에 적절하게 분배되도록 하는 것이 중요합니다.
또 다른 문제는 라우터 또는 레지스트리와 같은 중요한 인프라를 실행하는 노드를 처리하는 방법입니다. 동일한 노드 비우기 프로세스가 적용되지만 특정 엣지 케이스를 이해하는 것이 중요합니다.
2.10.1. 인프라 노드
인프라 노드는 OpenShift Container Platform 환경의 일부를 실행하도록 레이블이 지정된 노드입니다. 현재 노드 재부팅을 관리하는 가장 쉬운 방법은 인프라를 실행하는 데 사용 가능한 노드가 3개 이상 있는지 확인하는 것입니다. 아래 시나리오는 두 개의 노드만 사용할 수 있을 때 OpenShift Container Platform에서 실행되는 애플리케이션의 서비스 중단으로 이어질 수 있는 일반적인 실수를 보여줍니다.
- 노드 A가 예약 불가로 표시되고 모든 Pod가 비어 있습니다.
- 이제 해당 노드에서 실행 중인 레지스트리 포드가 B 노드에 재배포됩니다. 즉, 노드 B는 이제 두 레지스트리 포드를 모두 실행합니다.
- 이제 노드 B가 예약 불가로 표시되고 비어 있습니다.
- 노드 B에 두 포드 끝점을 노출하는 서비스는 잠시 동안 노드 A에 재배포될 때까지 모든 엔드포인트가 손실됩니다.
세 개의 인프라 노드를 사용하는 동일한 프로세스로 인해 서비스가 중단되지 않습니다. 그러나 Pod 예약으로 인해 비워진 후 되돌린 마지막 노드가 0개의 레지스트리를 실행 중인 상태로 남아 있습니다. 다른 두 노드는 각각 두 개의 레지스트리와 하나의 레지스트리를 실행합니다. 최상의 솔루션은 Pod 유사성 방지를 사용하는 것입니다. 이는 현재 테스트할 수 있지만 프로덕션 워크로드에서 아직 지원되지 않는 알파 기능입니다.
2.10.2. Pod 유사성 방지 사용
Pod 유사성 방지 는 노드 유사성 방지 와 약간 다릅니다. Pod를 배포할 다른 적절한 위치가 없는 경우 노드 유사성 방지를 위반할 수 있습니다. Pod 유사성 방지를 필수 또는 기본으로 설정할 수 있습니다.
apiVersion: v1 kind: Pod metadata: name: with-pod-antiaffinity spec: affinity: podAntiAffinity: 1 preferredDuringSchedulingIgnoredDuringExecution: 2 - weight: 100 3 podAffinityTerm: labelSelector: matchExpressions: - key: docker-registry 4 operator: In 5 values: - default topologyKey: kubernetes.io/hostname
이 예제에서는 컨테이너 이미지 레지스트리 포드에 docker-registry=default
레이블이 있다고 가정합니다. Pod 유사성 방지에서는 모든 Kubernetes 일치 표현식을 사용할 수 있습니다.
마지막 필수 단계는 /etc/origin/master/scheduler.json 에서 MatchInterPodAffinity
스케줄러 서술자를 활성화하는 것입니다. 이 경우 두 개의 인프라 노드만 사용할 수 있고 하나의 인프라 노드만 재부팅하면 컨테이너 이미지 레지스트리 포드가 다른 노드에서 실행되지 않습니다. oc get pods
는 적절한 노드를 사용할 수 있을 때까지 포드를 준비되지 않은 것으로 보고합니다. 노드를 사용할 수 있고 모든 Pod가 준비 상태가 되면 다음 노드를 재시작할 수 있습니다.
2.10.3. 라우터를 실행하는 노드 처리
대부분의 경우 OpenShift Container Platform 라우터를 실행하는 Pod는 호스트 포트를 노출합니다. PodFitsPorts
스케줄러 서술자를 사용하면 동일한 포트를 사용하는 라우터 Pod가 동일한 노드에서 실행되지 않으며 Pod 유사성 방지를 구현할 수 있습니다. 라우터가 고가용성을 위해 IP 페일오버를 사용하는 경우 추가로 필요한 것은 없습니다. 고가용성을 위해 AWS Elastic Load Balancing과 같은 외부 서비스를 사용하는 라우터 Pod의 경우 해당 서비스에서 라우터 Pod 재시작에 대응해야 합니다.
드물지만 라우터 포드에 호스트 포트가 구성되어 있지 않을 수 있습니다. 이러한 경우 인프라 노드에 권장되는 재시작 프로세스를 따라야 합니다.
2.11. 노드 수정
설치 중에 OpenShift Container Platform은 각 노드 그룹에 대해 openshift-node 프로젝트에 configmap을 생성합니다.
- node-config-master
- node-config-infra
- node-config-compute
- node-config-all-in-one
- node-config-master-infra
기존 노드를 구성하려면 적절한 구성 맵을 편집합니다. 각 노드의 동기화 Pod 는 구성 맵의 변경 사항을 감시합니다. 설치하는 동안 동기화 Pod는 동기화 Daemonsets 를 사용하고 노드 구성 매개 변수가 있는 /etc/origin/node/node-config.yaml 파일이 각 노드에 추가됩니다. 동기화 Pod에서 구성 맵 변경 사항을 탐지하면 해당 노드 그룹의 모든 노드에서 node-config.yaml 을 업데이트하고 적절한 노드에서 atomic-openshift-node.service 를 다시 시작합니다.
$ oc get cm -n openshift-node
출력 예
NAME DATA AGE node-config-all-in-one 1 1d node-config-compute 1 1d node-config-infra 1 1d node-config-master 1 1d node-config-master-infra 1 1d
node-config-compute 그룹의 구성 맵 샘플
apiVersion: v1 authConfig: 1 authenticationCacheSize: 1000 authenticationCacheTTL: 5m authorizationCacheSize: 1000 authorizationCacheTTL: 5m dnsBindAddress: 127.0.0.1:53 dnsDomain: cluster.local dnsIP: 0.0.0.0 2 dnsNameservers: null dnsRecursiveResolvConf: /etc/origin/node/resolv.conf dockerConfig: dockerShimRootDirectory: /var/lib/dockershim dockerShimSocket: /var/run/dockershim.sock execHandlerName: native enableUnidling: true imageConfig: format: registry.reg-aws.openshift.com/openshift3/ose-${component}:${version} latest: false iptablesSyncPeriod: 30s kind: NodeConfig kubeletArguments: 3 bootstrap-kubeconfig: - /etc/origin/node/bootstrap.kubeconfig cert-dir: - /etc/origin/node/certificates cloud-config: - /etc/origin/cloudprovider/aws.conf cloud-provider: - aws enable-controller-attach-detach: - 'true' feature-gates: - RotateKubeletClientCertificate=true,RotateKubeletServerCertificate=true node-labels: - node-role.kubernetes.io/compute=true pod-manifest-path: - /etc/origin/node/pods 4 rotate-certificates: - 'true' masterClientConnectionOverrides: acceptContentTypes: application/vnd.kubernetes.protobuf,application/json burst: 40 contentType: application/vnd.kubernetes.protobuf qps: 20 masterKubeConfig: node.kubeconfig networkConfig: 5 mtu: 8951 networkPluginName: redhat/openshift-ovs-subnet 6 servingInfo: 7 bindAddress: 0.0.0.0:10250 bindNetwork: tcp4 clientCA: client-ca.crt 8 volumeConfig: localQuota: perFSGroup: null volumeDirectory: /var/lib/origin/openshift.local.volumes
- 1
- 인증 및 권한 부여 구성 옵션.
- 2
- 포드의 /etc/resolv.conf 앞에 추가되는 IP 주소.
- 3
- Kubelet의 명령줄 인수 와 일치하는 Kubelet에 직접 전달되는 키 값 쌍입니다.
- 4
- Pod 매니페스트 파일 또는 디렉터리의 경로입니다. 디렉터리에는 하나 이상의 매니페스트 파일이 포함되어야 합니다. OpenShift Container Platform은 매니페스트 파일을 사용하여 노드에 Pod를 생성합니다.
- 5
- 노드의 Pod 네트워크 설정입니다.
- 6
- 소프트웨어 정의 네트워크(SDN) 플러그인. ovs
-subnet 플러그인의 경우 redhat/openshift-ovs
-subnet, ovs -multitenant 플러그인의 경우 redhat/openshift-ovs
-multitenant 또는 ovs -networkpolicy 플러그인의 경우 redhat/openshift-ovs
-networkpolicy 로 설정합니다. - 7
- 노드의 인증서 정보입니다.
- 8
- 선택 사항: PEM 인코딩 인증서 번들. 설정한 경우 요청 헤더에서 사용자 이름을 확인하기 전에 지정된 파일의 인증 기관에 대해 유효한 클라이언트 인증서를 제공하고 검증해야 합니다.
/etc/origin/node/node-config.yaml 파일을 수동으로 수정하지 마십시오.
2.11.1. 노드 리소스 구성
노드 구성 맵에 kubelet 인수를 추가하여 노드 리소스를 구성할 수 있습니다.
구성 맵을 편집합니다.
$ oc edit cm node-config-compute -n openshift-node
kubeletArguments
섹션을 추가하고 옵션을 지정합니다.kubeletArguments: max-pods: 1 - "40" resolv-conf: 2 - "/etc/resolv.conf" image-gc-high-threshold: 3 - "90" image-gc-low-threshold: 4 - "80" kube-api-qps: 5 - "20" kube-api-burst: 6 - "40"
사용 가능한 kubelet 옵션을 모두 보려면 다음을 수행합니다.
$ hyperkube kubelet -h
2.11.2. 노드당 최대 Pod 설정
각 OpenShift Container Platform 버전에 대해 지원되는 최대 한도는 클러스터 최대화 페이지를 참조하십시오.
/etc/origin/node/node-config.yaml 파일에서 하나의 매개변수는 노드에 예약할 수 있는 최대 Pod 수 를
제어합니다. max-pods
옵션을 사용하는 경우 노드의 Pod 수를 제한합니다. 이 값을 초과하면 다음과 같은 결과가 발생할 수 있습니다.
- OpenShift Container Platform 및 Docker 모두에 대한 CPU 사용률 증가
- Pod 예약 속도 저하.
- 메모리 부족 시나리오(노드의 메모리 크기에 따라 다름).
- IP 주소 모두 소진
- 리소스 초과 커밋으로 인한 사용자 애플리케이션 성능 저하
Kubernetes의 경우 단일 컨테이너를 보유한 하나의 Pod에서 실제로 두 개의 컨테이너가 사용됩니다. 두 번째 컨테이너는 실제 컨테이너 시작 전 네트워킹 설정에 사용됩니다. 따라서 10개의 Pod를 실행하는 시스템에서는 실제로 20개의 컨테이너가 실행됩니다.
max-pods
는 노드의 속성에 관계없이 노드가 실행할 수 있는 Pod 수를 고정 값으로 설정합니다. 클러스터 제한 은 max-pods에 대해 지원되는 최대 값을 문서화합니다
.
kubeletArguments: max-pods: - "250"
위 예를 사용하여 max-pods
의 기본값은 250
입니다.
2.12. Docker 스토리지 재설정
컨테이너 이미지를 다운로드하고 컨테이너를 실행하고 삭제할 때 Docker에서 매핑된 디스크 공간을 항상 확보하지는 않습니다. 결과적으로 시간이 지남에 따라 노드에서 공간이 부족하여 OpenShift Container Platform에서 새 Pod를 생성하거나 Pod를 생성하는 데 몇 분이 걸릴 수 있습니다.
예를 들어 다음은 6분 후에도 ContainerCreating
상태에 있는 Pod를 표시하고 이벤트 로그에 FailedSync 이벤트가 표시됩니다.
$ oc get pod
출력 예
NAME READY STATUS RESTARTS AGE cakephp-mysql-persistent-1-build 0/1 ContainerCreating 0 6m mysql-1-9767d 0/1 ContainerCreating 0 2m mysql-1-deploy 0/1 ContainerCreating 0 6m
$ oc get events
출력 예
LASTSEEN FIRSTSEEN COUNT NAME KIND SUBOBJECT TYPE REASON SOURCE MESSAGE 6m 6m 1 cakephp-mysql-persistent-1-build Pod Normal Scheduled default-scheduler Successfully assigned cakephp-mysql-persistent-1-build to ip-172-31-71-195.us-east-2.compute.internal 2m 5m 4 cakephp-mysql-persistent-1-build Pod Warning FailedSync kubelet, ip-172-31-71-195.us-east-2.compute.internal Error syncing pod 2m 4m 4 cakephp-mysql-persistent-1-build Pod Normal SandboxChanged kubelet, ip-172-31-71-195.us-east-2.compute.internal Pod sandbox changed, it will be killed and re-created.
이 문제에 대한 한 가지 해결책은 Docker에서 필요하지 않은 아티팩트를 제거하도록 Docker 스토리지를 재설정하는 것입니다.
Docker 스토리지를 다시 시작하려는 노드에서 다음을 수행합니다.
다음 명령을 실행하여 노드를 예약할 수 없음으로 표시합니다.
$ oc adm manage-node <node> --schedulable=false
다음 명령을 실행하여 Docker 및 atomic-openshift-node 서비스를 종료합니다.
$ systemctl stop docker atomic-openshift-node
다음 명령을 실행하여 로컬 볼륨 디렉터리를 제거합니다.
$ rm -rf /var/lib/origin/openshift.local.volumes
이 명령은 로컬 이미지 캐시를 지웁니다. 결과적으로 이미지(
ose-*
이미지 포함)를 다시 가져와야 합니다. 이렇게 하면 이미지 저장소가 복구되는 동안 Pod 시작 시간이 느려질 수 있습니다./var/lib/docker 디렉토리를 제거합니다.
$ rm -rf /var/lib/docker
다음 명령을 실행하여 Docker 스토리지를 재설정합니다.
$ docker-storage-setup --reset
다음 명령을 실행하여 Docker 스토리지를 다시 생성합니다.
$ docker-storage-setup
/var/lib/docker 디렉터리를 다시 생성합니다.
$ mkdir /var/lib/docker
다음 명령을 실행하여 Docker 및 atomic-openshift-node 서비스를 다시 시작합니다.
$ systemctl start docker atomic-openshift-node
호스트를 재부팅하여 노드 서비스를 다시 시작하십시오.
# systemctl restart atomic-openshift-node.service
다음 명령을 실행하여 노드를 예약 가능으로 표시합니다.
$ oc adm manage-node <node> --schedulable=true
3장. OpenShift Container Platform 구성 요소 복원
3.1. 개요
OpenShift Container Platform에서는 노드 및 애플리케이션을 포함한 클러스터 요소를 별도의 스토리지에서 다시 생성하여 클러스터 및 해당 구성 요소를 복원 할 수 있습니다.
클러스터를 복원하려면 먼저 클러스터를 백업해야 합니다.
다음 프로세스는 애플리케이션 및 OpenShift Container Platform 클러스터를 복원하는 일반적인 방법을 설명합니다. 사용자 정의 요구 사항은 반영할 수 없습니다. 클러스터를 복원하려면 추가 작업을 수행해야 할 수 있습니다.
3.2. 클러스터 복원
클러스터를 복원하려면 먼저 OpenShift Container Platform을 다시 설치합니다.
절차
- 원래 OpenShift Container Platform을 설치한 것과 동일한 방식으로 OpenShift Container Platform을 다시 설치합니다.
- OpenShift Container Platform의 제어 범위를 벗어나 서비스를 변경하거나 모니터링 에이전트와 같은 추가 서비스를 설치하는 등 모든 사용자 정의 설치 후 단계를 실행합니다.
3.3. 마스터 호스트 백업 복원
중요한 마스터 호스트 파일의 백업을 생성한 후, 파일이 손상되거나 실수로 제거된 경우 파일을 다시 마스터로 복사하고 파일에 올바른 콘텐츠가 포함되어 있는지 확인한 다음 영향을 받는 서비스를 다시 시작하여 파일을 복원할 수 있습니다.
프로시저
/etc/origin/master/master-config.yaml
파일을 복원하십시오.# MYBACKUPDIR=*/backup/$(hostname)/$(date +%Y%m%d)* # cp /etc/origin/master/master-config.yaml /etc/origin/master/master-config.yaml.old # cp /backup/$(hostname)/$(date +%Y%m%d)/origin/master/master-config.yaml /etc/origin/master/master-config.yaml # master-restart api # master-restart controllers
주의마스터 서비스를 다시 시작하면 다운 타임이 발생할 수 있습니다. 그러나 고가용성 로드 밸런서 풀에서 마스터 호스트를 제거한 다음, 복원 작업을 수행할 수 있습니다. 서비스가 올바르게 복원되면 마스터 호스트를 다시 로드 밸런서 풀에 추가할 수 있습니다.
참고영향을 받는 인스턴스를 완전히 재부팅하여
iptables
구성을 복원하십시오.패키지가 없어서 OpenShift Container Platform을 다시 시작할 수 없는 경우 패키지를 다시 설치하십시오.
현재 설치된 패키지 목록을 가져오십시오.
$ rpm -qa | sort > /tmp/current_packages.txt
패키지 목록의 차이점을 확인하십시오.
$ diff /tmp/current_packages.txt ${MYBACKUPDIR}/packages.txt > ansible-2.4.0.0-5.el7.noarch
누락된 패키지를 다시 설치하십시오.
# yum reinstall -y <packages> 1
- 1
<packages>
를 패키지 목록 간에 차이가 있는 패키지로 교체하십시오.
인증서를
/etc/pki/ca-trust/source/anchors/ 디렉토리에 복사하고
를 실행하여 시스템 인증서를 복원합니다.update-ca
-trust$ MYBACKUPDIR=*/backup/$(hostname)/$(date +%Y%m%d)* $ sudo cp ${MYBACKUPDIR}/etc/pki/ca-trust/source/anchors/<certificate> /etc/pki/ca-trust/source/anchors/ 1 $ sudo update-ca-trust
- 1
<certificate>
를 복원할 시스템 인증서의 파일 이름으로 바꿉니다.
참고SELinux
컨텍스트뿐만 아니라 파일을 다시 복사할 때 사용자 ID와 그룹 ID가 복원되는지 항상 확인하십시오.
3.4. 노드 호스트 백업 복원
중요한 노드 호스트 파일의 백업을 생성한 후, 파일이 손상되거나 실수로 제거된 경우 파일을 다시 복사하고 파일에 올바른 콘텐츠가 포함되어 있는지 확인한 다음 영향을 받는 서비스를 다시 시작하여 파일을 복원할 수 있습니다.
프로시저
/etc/origin/node/node-config.yaml
파일을 복원하십시오.# MYBACKUPDIR=/backup/$(hostname)/$(date +%Y%m%d) # cp /etc/origin/node/node-config.yaml /etc/origin/node/node-config.yaml.old # cp /backup/$(hostname)/$(date +%Y%m%d)/etc/origin/node/node-config.yaml /etc/origin/node/node-config.yaml # reboot
서비스를 다시 시작하면 다운 타임이 발생할 수 있습니다. 프로세스를 쉽게 수행하는 방법에 관한 팁은 노드 유지보수를 참조하십시오.
영향을 받는 인스턴스를 완전히 재부팅하여 iptables
구성을 복원하십시오.
패키지가 없어서 OpenShift Container Platform을 다시 시작할 수 없는 경우 패키지를 다시 설치하십시오.
현재 설치된 패키지 목록을 가져오십시오.
$ rpm -qa | sort > /tmp/current_packages.txt
패키지 목록의 차이점을 확인하십시오.
$ diff /tmp/current_packages.txt ${MYBACKUPDIR}/packages.txt > ansible-2.4.0.0-5.el7.noarch
누락된 패키지를 다시 설치하십시오.
# yum reinstall -y <packages> 1
- 1
<packages>
를 패키지 목록 간에 차이가 있는 패키지로 교체하십시오.
인증서를
/etc/pki/ca-trust/source/anchors/ 디렉토리에 복사하고
를 실행하여 시스템 인증서를 복원합니다.update-ca
-trust$ MYBACKUPDIR=*/backup/$(hostname)/$(date +%Y%m%d)* $ sudo cp ${MYBACKUPDIR}/etc/pki/ca-trust/source/anchors/<certificate> /etc/pki/ca-trust/source/anchors/ $ sudo update-ca-trust
<certificate>
를 복원할 시스템 인증서의 파일 이름으로 바꿉니다.
참고SELinux
컨텍스트뿐만 아니라 파일을 다시 복사할 때 적절한 사용자 ID와 그룹 ID가 복원되는지 항상 확인하십시오.
3.5. etcd 복원
3.5.1. etcd 구성 파일 복원
etcd 호스트가 손상되고 /etc/etcd/etcd.conf
파일이 손실된 경우 다음 절차를 사용하여 복원하십시오.
etcd 호스트에 액세스합니다.
$ ssh master-0 1
- 1
master-0
을 etcd 호스트 이름으로 교체합니다.
백업
etcd.conf
파일을/etc/etcd/
에 복사합니다.# cp /backup/etcd-config-<timestamp>/etcd/etcd.conf /etc/etcd/etcd.conf
파일에 필요한 권한 및 selinux 컨텍스트를 설정합니다.
# restorecon -RvF /etc/etcd/etcd.conf
이 예제에서 백업 파일은 /backup/etcd-config-<timestamp>/etcd/etcd.conf
경로에 저장되며, 여기에서 외부 NFS 공유, S3 버킷 또는 기타 스토리지 솔루션으로 사용할 수 있습니다.
etcd 구성 파일을 복원한 후 정적 pod를 다시 시작해야 합니다. etcd 데이터를 복원한 후 수행됩니다.
3.5.2. etcd 데이터 복원
정적 포드에서 etcd를 복원하기 전에 다음을 수행하십시오.
etcdctl
바이너리가 사용 가능해야 합니다. 컨테이너화된 설치에서는rhel7/etcd
컨테이너를 사용할 수 있어야 합니다.다음 명령을 실행하여 etcd 패키지로
etcdctl
바이너리를 설치할 수 있습니다.# yum install etcd
이 패키지에서는 systemd 서비스도 설치합니다. etcd가 정적 포드에서 실행될 때 systemd 서비스로 실행되지 않도록 서비스를 비활성화하고 마스킹하십시오. 서비스를 비활성화하고 마스킹함으로써 실수로 서비스를 시작하는 일이 없게 하고 시스템을 재부팅할 때 서비스가 자동으로 다시 시작되지 않게 할 수 있습니다.
# systemctl disable etcd.service
# systemctl mask etcd.service
정적 포드에서 etcd를 복원하려면 다음을 수행하십시오.
포드가 실행 중이면 포드 매니페스트 YAML 파일을 다른 디렉터리로 이동하여 etcd 포드를 중지하십시오.
# mkdir -p /etc/origin/node/pods-stopped
# mv /etc/origin/node/pods/etcd.yaml /etc/origin/node/pods-stopped
이전 데이터를 모두 이동합니다.
# mv /var/lib/etcd /var/lib/etcd.old
포드를 복원할 노드에서 etcdctl을 사용하여 데이터를 다시 생성합니다.
etcd 스냅샷을 etcd 포드의 마운트 경로로 복원하십시오.
# export ETCDCTL_API=3
# etcdctl snapshot restore /etc/etcd/backup/etcd/snapshot.db \ --data-dir /var/lib/etcd/ \ --name ip-172-18-3-48.ec2.internal \ --initial-cluster "ip-172-18-3-48.ec2.internal=https://172.18.3.48:2380" \ --initial-cluster-token "etcd-cluster-1" \ --initial-advertise-peer-urls https://172.18.3.48:2380 \ --skip-hash-check=true
백업 etcd.conf 파일에서 클러스터에 적절한 값을 가져옵니다.
데이터 디렉터리에서 필요한 권한 및 selinux 컨텍스트를 설정하십시오.
# restorecon -RvF /var/lib/etcd/
포드 매니페스트 YAML 파일을 필요한 디렉터리로 이동하여 etcd 포드를 다시 시작하십시오.
# mv /etc/origin/node/pods-stopped/etcd.yaml /etc/origin/node/pods/
3.6. etcd 노드 추가
etcd를 복원한 후 클러스터에 etcd 노드를 추가할 수 있습니다. Ansible 플레이북을 사용하거나 수동 단계를 통해 etcd 호스트를 추가할 수 있습니다.
3.6.1. Ansible을 사용하여 새 etcd 호스트 추가
프로시저
Ansible 인벤토리 파일에서
[new_etcd]
라는 새 그룹을 생성하고 새 호스트를 추가하십시오. 그런 다음new_etcd
그룹을[OSEv3]
그룹의 하위 그룹으로 추가하십시오.[OSEv3:children] masters nodes etcd new_etcd 1 ... [OUTPUT ABBREVIATED] ... [etcd] master-0.example.com master-1.example.com master-2.example.com [new_etcd] 2 etcd0.example.com 3
참고이전
etcd 호스트
항목을 인벤토리 파일의 새etcd 호스트
항목으로 교체합니다. 이전etcd 호스트
를 교체하는 동안/etc/etcd/ca/
디렉터리 사본을 생성해야 합니다. 또는 etcd호스트
를 확장하기 전에 etcd ca 및 certs를 재배포할 수 있습니다.OpenShift Container Platform이 설치되어 있고 Ansible 인벤토리 파일을 호스팅하는 호스트에서 플레이북 디렉터리로 이동하여 etcd
scaleup
플레이북을 실행하십시오.$ cd /usr/share/ansible/openshift-ansible $ ansible-playbook playbooks/openshift-etcd/scaleup.yml
플레이북을 실행한 다음 새 etcd 호스트를
[new_etcd]
그룹에서[etcd]
그룹으로 이동하여 현재 상태에 맞게 인벤토리 파일을 수정하십시오.[OSEv3:children] masters nodes etcd new_etcd ... [OUTPUT ABBREVIATED] ... [etcd] master-0.example.com master-1.example.com master-2.example.com etcd0.example.com
Flannel을 사용하는 경우 새 etcd 호스트를 포함하도록
/etc/sysconfig/flanneld
에 있는 모든 OpenShift Container Platform 호스트에서flanneld
서비스 구성을 수정하십시오.FLANNEL_ETCD_ENDPOINTS=https://master-0.example.com:2379,https://master-1.example.com:2379,https://master-2.example.com:2379,https://etcd0.example.com:2379
flanneld
서비스를 다시 시작하십시오.# systemctl restart flanneld.service
3.6.2. 새 etcd 호스트 수동 추가
마스터 노드에서 etcd를 정적 포드로 실행하지 않으면 다른 etcd 호스트를 추가해야 할 수도 있습니다.
프로시저
현재 etcd 클러스터 수정
etcd 인증서를 생성하려면 값을 사용자 환경의 값으로 교체하여 openssl
명령을 실행하십시오.
다음과 같이 일부 환경 변수를 생성하십시오.
export NEW_ETCD_HOSTNAME="*etcd0.example.com*" export NEW_ETCD_IP="192.168.55.21" export CN=$NEW_ETCD_HOSTNAME export SAN="IP:${NEW_ETCD_IP}, DNS:${NEW_ETCD_HOSTNAME}" export PREFIX="/etc/etcd/generated_certs/etcd-$CN/" export OPENSSLCFG="/etc/etcd/ca/openssl.cnf"
참고etcd_v3_ca_*
로 사용되는 사용자 정의openssl
확장에는 $SAN 환경 변수가subjectAltName
으로 포함됩니다. 자세한 내용은/etc/etcd/ca/openssl.cnf
를 참조하십시오.구성 및 인증서를 저장할 디렉터리를 생성하십시오.
# mkdir -p ${PREFIX}
서버 인증서 요청을 생성하고 서명하십시오(server.csr 및 server.crt).
# openssl req -new -config ${OPENSSLCFG} \ -keyout ${PREFIX}server.key \ -out ${PREFIX}server.csr \ -reqexts etcd_v3_req -batch -nodes \ -subj /CN=$CN # openssl ca -name etcd_ca -config ${OPENSSLCFG} \ -out ${PREFIX}server.crt \ -in ${PREFIX}server.csr \ -extensions etcd_v3_ca_server -batch
피어 인증서 요청을 생성하고 서명하십시오(peer.csr 및 peer.crt).
# openssl req -new -config ${OPENSSLCFG} \ -keyout ${PREFIX}peer.key \ -out ${PREFIX}peer.csr \ -reqexts etcd_v3_req -batch -nodes \ -subj /CN=$CN # openssl ca -name etcd_ca -config ${OPENSSLCFG} \ -out ${PREFIX}peer.crt \ -in ${PREFIX}peer.csr \ -extensions etcd_v3_ca_peer -batch
나중에 수정하기 위해 현재 노드의 현재 etcd 구성 및
ca.crt
파일을 예제로 복사하십시오.# cp /etc/etcd/etcd.conf ${PREFIX} # cp /etc/etcd/ca.crt ${PREFIX}
아직 남아 있는 etcd 호스트에서 새 호스트를 클러스터에 추가하십시오. 클러스터에 etcd 멤버를 추가하려면 먼저 첫 번째 멤버의
peerURLs
값에서 기본 localhost 피어를 조정해야 합니다.member list
명령을 사용하여 첫 번째 멤버의 멤버 ID를 가져오십시오.# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://172.18.1.18:2379,https://172.18.9.202:2379,https://172.18.0.75:2379" \ 1 member list
- 1
--peers
매개변수 값에 활성 etcd 멤버의 URL만 지정하십시오.
etcd가 클러스터 피어를 청취하는 IP 주소를 확보하십시오.
$ ss -l4n | grep 2380
멤버 ID와 이전 단계에서 얻은 IP 주소를 전달하여
etcdctl member update
명령으로peerURLs
의 값을 업데이트하십시오.# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://172.18.1.18:2379,https://172.18.9.202:2379,https://172.18.0.75:2379" \ member update 511b7fb6cc0001 https://172.18.1.18:2380
-
member list
명령을 다시 실행하고 피어 URL에 더 이상 localhost가 포함되지 않도록 하십시오.
새 호스트를 etcd 클러스터에 추가하십시오. 새 호스트는 아직 구성되지 않았으므로 새 호스트를 구성할 때까지 상태는
unstarted
로 남아 있습니다.주의각 멤버를 추가하고 한 번에 하나씩 온라인 상태로 만들어야 합니다. 각 멤버를 클러스터에 추가할 때 현재 피어의
peerURL
목록을 조정해야 합니다.peerURL
목록은 각 멤버가 추가될 때마다 하나씩 늘어납니다.etcdctl member add
명령은 다음 지침에 설명된 대로 각 멤버를 추가할 때 etcd.conf 파일에 설정해야 하는 값을 출력합니다.# etcdctl -C https://${CURRENT_ETCD_HOST}:2379 \ --ca-file=/etc/etcd/ca.crt \ --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key member add ${NEW_ETCD_HOSTNAME} https://${NEW_ETCD_IP}:2380 1 Added member named 10.3.9.222 with ID 4e1db163a21d7651 to cluster ETCD_NAME="<NEW_ETCD_HOSTNAME>" ETCD_INITIAL_CLUSTER="<NEW_ETCD_HOSTNAME>=https://<NEW_HOST_IP>:2380,<CLUSTERMEMBER1_NAME>=https:/<CLUSTERMEMBER2_IP>:2380,<CLUSTERMEMBER2_NAME>=https:/<CLUSTERMEMBER2_IP>:2380,<CLUSTERMEMBER3_NAME>=https:/<CLUSTERMEMBER3_IP>:2380" ETCD_INITIAL_CLUSTER_STATE="existing"
- 1
- 이 라인에서
10.3.9.222
는 etcd 멤버의 레이블입니다. 호스트 이름, IP 주소 또는 간단한 이름을 지정할 수 있습니다.
샘플
${PREFIX}/etcd.conf
파일을 업데이트하십시오.다음 값을 이전 단계에서 생성된 값으로 교체하십시오.
- ETCD_NAME
- ETCD_INITIAL_CLUSTER
- ETCD_INITIAL_CLUSTER_STATE
이전 단계의 출력에서 얻은 새 호스트 IP로 다음 변수를 수정하십시오.
${NEW_ETCD_IP}
를 값으로 사용할 수 있습니다.ETCD_LISTEN_PEER_URLS ETCD_LISTEN_CLIENT_URLS ETCD_INITIAL_ADVERTISE_PEER_URLS ETCD_ADVERTISE_CLIENT_URLS
- 이전에 멤버 시스템을 etcd 노드로 사용한 경우 /etc/etcd/etcd.conf 파일에서 현재 값을 덮어써야 합니다.
구문 오류 또는 누락된 IP 주소가 있는지 파일을 확인하십시오. 그렇지 않으면 etcd 서비스가 실패할 수 있습니다.
# vi ${PREFIX}/etcd.conf
-
설치 파일을 호스팅하는 노드에서 /etc/ansible/hosts 인벤토리 파일의
[etcd]
호스트 그룹을 업데이트하십시오. 이전 etcd 호스트를 제거하고 새 호스트를 추가하십시오. 인증서, 샘플 구성 파일 및
ca
가 포함된tgz
파일을 생성하여 새 호스트에 복사하십시오.# tar -czvf /etc/etcd/generated_certs/${CN}.tgz -C ${PREFIX} . # scp /etc/etcd/generated_certs/${CN}.tgz ${CN}:/tmp/
새 etcd 호스트 수정
iptables-services
를 설치하여 etcd의 필수 포트를 여는 iptables 유틸리티를 제공하십시오.# yum install -y iptables-services
etcd가 통신할 수 있도록
OS_FIREWALL_ALLOW
방화벽 규칙을 생성하십시오.- 클라이언트용 2379/tcp 포트
피어 통신용 2380/tcp 포트
# systemctl enable iptables.service --now # iptables -N OS_FIREWALL_ALLOW # iptables -t filter -I INPUT -j OS_FIREWALL_ALLOW # iptables -A OS_FIREWALL_ALLOW -p tcp -m state --state NEW -m tcp --dport 2379 -j ACCEPT # iptables -A OS_FIREWALL_ALLOW -p tcp -m state --state NEW -m tcp --dport 2380 -j ACCEPT # iptables-save | tee /etc/sysconfig/iptables
참고이 예에서는 새 체인
OS_FIREWALL_ALLOW
가 생성되는데, 이는 OpenShift Container Platform 설치 프로그램이 방화벽 규칙에 사용하는 표준 이름입니다.주의IaaS 환경에서 사용자 환경을 호스팅하는 경우 해당 포트로 들어오는 트래픽도 허용하도록 인스턴스의 보안 그룹을 수정하십시오.
etcd를 설치하십시오.
# yum install -y etcd
버전
etcd-2.3.7-4.el7.x86_64
이상이 설치되어 있는지 확인하십시오.etcd 포드 정의를 제거하여 etcd 서비스가 실행 중이지 않은지 확인하십시오.
# mkdir -p /etc/origin/node/pods-stopped # mv /etc/origin/node/pods/* /etc/origin/node/pods-stopped/
etcd 구성 및 데이터를 제거하십시오.
# rm -Rf /etc/etcd/* # rm -Rf /var/lib/etcd/*
인증서 및 구성 파일을 추출하십시오.
# tar xzvf /tmp/etcd0.example.com.tgz -C /etc/etcd/
새 호스트에서 etcd를 시작하십시오.
# systemctl enable etcd --now
호스트가 클러스터의 일부인지 확인하고 현재 클러스터 상태를 점검하십시오.
v2 etcd API를 사용하는 경우 다음 명령을 실행하십시오.
# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://*master-0.example.com*:2379,\ https://*master-1.example.com*:2379,\ https://*master-2.example.com*:2379,\ https://*etcd0.example.com*:2379"\ cluster-health member 5ee217d19001 is healthy: got healthy result from https://192.168.55.12:2379 member 2a529ba1840722c0 is healthy: got healthy result from https://192.168.55.8:2379 member 8b8904727bf526a5 is healthy: got healthy result from https://192.168.55.21:2379 member ed4f0efd277d7599 is healthy: got healthy result from https://192.168.55.13:2379 cluster is healthy
v3 etcd API를 사용하는 경우 다음 명령을 실행하십시오.
# ETCDCTL_API=3 etcdctl --cert="/etc/etcd/peer.crt" \ --key=/etc/etcd/peer.key \ --cacert="/etc/etcd/ca.crt" \ --endpoints="https://*master-0.example.com*:2379,\ https://*master-1.example.com*:2379,\ https://*master-2.example.com*:2379,\ https://*etcd0.example.com*:2379"\ endpoint health https://master-0.example.com:2379 is healthy: successfully committed proposal: took = 5.011358ms https://master-1.example.com:2379 is healthy: successfully committed proposal: took = 1.305173ms https://master-2.example.com:2379 is healthy: successfully committed proposal: took = 1.388772ms https://etcd0.example.com:2379 is healthy: successfully committed proposal: took = 1.498829ms
각 OpenShift Container Platform 마스터 수정
모든 마스터에서
/etc/origin/master/master-config.yaml
파일의etcClientInfo
섹션에서 마스터 구성을 수정하십시오. OpenShift Container Platform에서 데이터를 저장하는 데 사용하는 etcd 서버 목록에 새 etcd 호스트를 추가하고 실패한 etcd 호스트를 제거하십시오.etcdClientInfo: ca: master.etcd-ca.crt certFile: master.etcd-client.crt keyFile: master.etcd-client.key urls: - https://master-0.example.com:2379 - https://master-1.example.com:2379 - https://master-2.example.com:2379 - https://etcd0.example.com:2379
마스터 API 서비스를 다시 시작하십시오.
모든 마스터에서 다음을 수행하십시오.
# master-restart api # master-restart controllers
주의etcd 노드의 수는 홀수여야 하므로 2개 이상의 호스트를 추가해야 합니다.
Flannel을 사용하는 경우 새 etcd 호스트를 포함하도록 모든 OpenShift Container Platform 호스트에서
/etc/sysconfig/flanneld
에 있는flanneld
서비스 구성을 수정하십시오.FLANNEL_ETCD_ENDPOINTS=https://master-0.example.com:2379,https://master-1.example.com:2379,https://master-2.example.com:2379,https://etcd0.example.com:2379
flanneld
서비스를 다시 시작하십시오.# systemctl restart flanneld.service
3.7. OpenShift Container Platform 서비스를 다시 온라인 상태로 되돌리기
변경 사항을 완료한 후 OpenShift Container Platform을 다시 온라인 상태로 전환합니다.
절차
각 OpenShift Container Platform 마스터에서 백업에서 마스터 및 노드 구성을 복원하고 관련 서비스를 모두 활성화하고 다시 시작합니다.
# cp ${MYBACKUPDIR}/etc/origin/node/pods/* /etc/origin/node/pods/ # cp ${MYBACKUPDIR}/etc/origin/master/master.env /etc/origin/master/master.env # cp ${MYBACKUPDIR}/etc/origin/master/master-config.yaml.<timestamp> /etc/origin/master/master-config.yaml # cp ${MYBACKUPDIR}/etc/origin/node/node-config.yaml.<timestamp> /etc/origin/node/node-config.yaml # cp ${MYBACKUPDIR}/etc/origin/master/scheduler.json.<timestamp> /etc/origin/master/scheduler.json # master-restart api # master-restart controllers
각 OpenShift Container Platform 노드에서 필요에 따라 노드 구성 맵을 업데이트하고 atomic-openshift-node 서비스를 활성화하고 다시 시작합니다.
# cp /etc/origin/node/node-config.yaml.<timestamp> /etc/origin/node/node-config.yaml # systemctl enable atomic-openshift-node # systemctl start atomic-openshift-node
3.8. 프로젝트 복원
프로젝트를 복원하려면 새 프로젝트를 생성한 다음 oc create -f <file_name>
을 실행하여 내보낸 파일을 복원합니다.
절차
프로젝트를 생성합니다.
$ oc new-project <project_name> 1
- 1
- 이
<project_name>
값은 백업된 프로젝트 이름과 일치해야 합니다.
프로젝트 오브젝트를 가져옵니다.
$ oc create -f project.yaml
역할 바인딩, 시크릿, 서비스 계정 및 영구 볼륨 클레임과 같이 프로젝트를 백업할 때 내보낸 다른 리소스를 가져옵니다.
$ oc create -f <object>.yaml
일부 리소스를 가져오려면 다른 오브젝트를 가져오지 못할 수 있습니다. 이 경우 오류 메시지를 검토하여 먼저 가져와야 하는 리소스를 확인합니다.
포드 및 기본 서비스 계정과 같은 일부 리소스는 생성되지 않을 수 있습니다.
3.9. 애플리케이션 데이터 복원
컨테이너 이미지 내에 rsync가 설치되어
있다고 가정하면 oc rsync
명령을 사용하여 애플리케이션 데이터를 복원할 수 있습니다. Red Hat rhel7 기본 이미지에는 rsync
가 포함되어 있습니다. 따라서 rhel7을 기반으로 하는 모든 이미지에도 포함됩니다. CLI 작업 문제 해결 및 디버깅 - rsync를 참조하십시오.
이는 애플리케이션 데이터의 일반적인 복원이며 데이터베이스 시스템의 특수 내보내기 및 가져오기 프로시저와 같이 애플리케이션별 백업 프로시저는 고려하지 않습니다.
Cinder, NFS 또는 Gluster와 같이 사용하는 영구 볼륨의 유형에 따라 다른 복원 방법이 존재할 수 있습니다.
절차
Jenkins 배포의 애플리케이션 데이터 복원 예
백업을 확인합니다.
$ ls -la /tmp/jenkins-backup/ total 8 drwxrwxr-x. 3 user user 20 Sep 6 11:14 . drwxrwxrwt. 17 root root 4096 Sep 6 11:16 .. drwxrwsrwx. 12 user user 4096 Sep 6 11:14 jenkins
oc rsync
툴을 사용하여 데이터를 실행 중인 포드에 복사합니다.$ oc rsync /tmp/jenkins-backup/jenkins jenkins-1-37nux:/var/lib
참고애플리케이션에 따라 애플리케이션을 다시 시작해야 할 수 있습니다.
선택적으로 새 데이터를 사용하여 애플리케이션을 다시 시작합니다.
$ oc delete pod jenkins-1-37nux
또는 배포를 0으로 축소한 다음 다시 확장할 수 있습니다.
$ oc scale --replicas=0 dc/jenkins $ oc scale --replicas=1 dc/jenkins
3.10. 영구 볼륨 클레임 복원
이 주제에서는 데이터 복원을 위한 두 가지 방법을 설명합니다. 첫 번째는 파일을 삭제한 다음 파일을 예상 위치에 다시 배치해야 합니다. 두 번째 예는 영구 볼륨 클레임 마이그레이션을 보여줍니다. 스토리지를 이동해야 하거나 백엔드 스토리지가 더 이상 존재하지 않는 재해 시나리오에서 마이그레이션이 발생했습니다.
데이터를 애플리케이션으로 복원하는 데 필요한 모든 단계에서 특정 애플리케이션의 복원 프로시저가 있는지 확인합니다.
3.10.1. 기존 PVC로 파일 복원
프로시저
파일을 삭제하십시오.
$ oc rsh demo-2-fxx6d sh-4.2$ ls */opt/app-root/src/uploaded/* lost+found ocp_sop.txt sh-4.2$ *rm -rf /opt/app-root/src/uploaded/ocp_sop.txt* sh-4.2$ *ls /opt/app-root/src/uploaded/* lost+found
PVC에 있던 파일의 rsync 백업이 포함된 서버에서 파일을 교체하십시오.
$ oc rsync uploaded demo-2-fxx6d:/opt/app-root/src/
oc rsh
를 사용하여 포드에 연결하고 디렉터리의 콘텐츠를 확인하여 파일이 다시 포드에 있는지 확인하십시오.$ oc rsh demo-2-fxx6d sh-4.2$ *ls /opt/app-root/src/uploaded/* lost+found ocp_sop.txt
3.10.2. 새로운 PVC로 데이터 복원
다음 단계에서는 새 pvc
가 작성되었다고 가정합니다.
프로시저
현재 정의된
claim-name
을 덮어 쓰십시오.$ oc set volume dc/demo --add --name=persistent-volume \ --type=persistentVolumeClaim --claim-name=filestore \ --mount-path=/opt/app-root/src/uploaded --overwrite
포드에서 새로운 PVC를 사용하고 있는지 확인하십시오.
$ oc describe dc/demo Name: demo Namespace: test Created: 3 hours ago Labels: app=demo Annotations: openshift.io/generated-by=OpenShiftNewApp Latest Version: 3 Selector: app=demo,deploymentconfig=demo Replicas: 1 Triggers: Config, Image(demo@latest, auto=true) Strategy: Rolling Template: Labels: app=demo deploymentconfig=demo Annotations: openshift.io/container.demo.image.entrypoint=["container-entrypoint","/bin/sh","-c","$STI_SCRIPTS_PATH/usage"] openshift.io/generated-by=OpenShiftNewApp Containers: demo: Image: docker-registry.default.svc:5000/test/demo@sha256:0a9f2487a0d95d51511e49d20dc9ff6f350436f935968b0c83fcb98a7a8c381a Port: 8080/TCP Volume Mounts: /opt/app-root/src/uploaded from persistent-volume (rw) Environment Variables: <none> Volumes: persistent-volume: Type: PersistentVolumeClaim (a reference to a PersistentVolumeClaim in the same namespace) *ClaimName: filestore* ReadOnly: false ...omitted...
배포 구성에서 새 PVC를 사용하므로
oc rsync
를실행하여
파일을 새 PVC에 배치합니다.$ oc rsync uploaded demo-3-2b8gs:/opt/app-root/src/ sending incremental file list uploaded/ uploaded/ocp_sop.txt uploaded/lost+found/ sent 181 bytes received 39 bytes 146.67 bytes/sec total size is 32 speedup is 0.15
oc rsh
를 사용하여 포드에 연결하고 디렉터리의 콘텐츠를 확인하여 파일이 다시 포드에 있는지 확인하십시오.$ oc rsh demo-3-2b8gs sh-4.2$ ls /opt/app-root/src/uploaded/ lost+found ocp_sop.txt
4장. 마스터 호스트 교체
실패한 마스터 호스트를 교체할 수 있습니다.
먼저 클러스터에서 실패한 마스터 호스트를 제거한 다음 대체 마스터 호스트를 추가합니다. 실패한 마스터 호스트에서 etcd를 실행한 경우 새 마스터 호스트에 etcd를 추가하여 etcd를 확장합니다.
이 주제의 모든 섹션을 완료해야 합니다.
4.1. 마스터 호스트 사용 중단
마스터 호스트에서는 OpenShift Container Platform API 및 컨트롤러 서비스와 같은 중요한 서비스를 실행합니다. 마스터 호스트를 사용 중단하려면 이러한 서비스를 중지해야 합니다.
OpenShift Container Platform API 서비스는 활성/활성 서비스이므로, 요청을 별도의 마스터 서버로 보내는 한 서비스를 중지해도 환경에 영향을 미치지 않습니다. 그러나 OpenShift Container Platform 컨트롤러 서비스는 활성/수동 서비스이며, 이 경우 서비스에서 etcd를 사용하여 활성 마스터를 결정합니다.
다중 마스터 아키텍처에서 마스터 호스트를 사용 중단하려면 새로운 연결에서 해당 마스터를 사용하려고 시도하지 않도록 로드 밸런서 풀에서 마스터를 제거해야 합니다. 이 프로세스는 사용 중인 로드 밸런서에 따라 크게 달라집니다. 아래 단계에서는 haproxy
에서 마스터를 제거하는 방법을 자세히 보여줍니다. OpenShift Container Platform이 클라우드 공급자에서 실행 중이거나 F5
어플라이언스를 사용하는 경우 해당하는 제품 문서를 참조하여 마스터가 순환 사용되지 않게 제거하십시오.
프로시저
/etc/haproxy/haproxy.cfg
구성 파일에서backend
섹션을 제거하십시오. 예를 들어haproxy
를 사용하여master-0.example.com
이라는 마스터를 사용 중단하는 경우 호스트 이름이 다음에서 제거되었는지 확인하십시오.backend mgmt8443 balance source mode tcp # MASTERS 8443 server master-1.example.com 192.168.55.12:8443 check server master-2.example.com 192.168.55.13:8443 check
그런 다음
haproxy
서비스를 다시 시작하십시오.$ sudo systemctl restart haproxy
마스터가 로드 밸런서에서 제거되면 정적 포드 디렉터리 /etc/origin/node/pods에서 정의 파일을 이동하여 API와 컨트롤러 서비스를 비활성화하십시오.
# mkdir -p /etc/origin/node/pods/disabled # mv /etc/origin/node/pods/controller.yaml /etc/origin/node/pods/disabled/: +
- 마스터 호스트는 스케줄링 가능한 OpenShift 컨테이너 플랫폼 노드이므로 노드 호스트 사용 중단 섹션의 단계를 따르십시오.
/etc/ansible/hosts
Ansible 인벤토리 파일의[masters]
및[nodes]
그룹에서 마스터 호스트를 제거하여 해당 인벤토리 파일로 Ansible 작업을 실행할 때 문제가 발생하지 않도록 하십시오.주의Ansible 인벤토리 파일에 나열된 첫 번째 마스터 호스트를 사용 중단하려면 추가 예방 조치가 필요합니다.
/etc/origin/master/ca.serial.txt
파일은 Ansible 호스트 인벤토리에 나열된 첫 번째 마스터에서만 생성됩니다. 첫 번째 마스터 호스트를 더 이상 사용하지 않는 경우 프로세스 전에/etc/origin/master/ca.serial.txt
파일을 나머지 마스터 호스트에 복사하십시오.중요여러 마스터를 실행하는 OpenShift Container Platform 3.11 클러스터에서는 마스터 노드 중 하나의
/etc/origin/master
,/etc/etcd/ca
및/etc/etcd/generated_certs
에 추가 CA 인증서가 들어 있습니다. 이 인증서는 애플리케이션 노드 및 etcd 노드 확장 작업에 필요하며, CA 호스트 마스터를 사용 중단하는 경우 다른 마스터 노드에 복원해야 합니다.kubernetes
서비스에는 마스터 호스트 IP가 끝점으로 포함되어 있습니다. 마스터가 올바르게 사용 중단되었는지 확인하려면kubernetes
서비스 출력을 검토하여 사용 중단된 마스터가 제거되었는지 확인하십시오.$ oc describe svc kubernetes -n default Name: kubernetes Namespace: default Labels: component=apiserver provider=kubernetes Annotations: <none> Selector: <none> Type: ClusterIP IP: 10.111.0.1 Port: https 443/TCP Endpoints: 192.168.55.12:8443,192.168.55.13:8443 Port: dns 53/UDP Endpoints: 192.168.55.12:8053,192.168.55.13:8053 Port: dns-tcp 53/TCP Endpoints: 192.168.55.12:8053,192.168.55.13:8053 Session Affinity: ClientIP Events: <none>
마스터가 사용 중단되면 이전에 그 마스터를 실행하던 호스트를 안전하게 삭제할 수 있습니다.
4.2. 호스트 추가
scaleup.yml 플레이북을 실행하여 클러스터에 새 호스트를 추가할 수 있습니다. 이 플레이북은 마스터를 쿼리하고 새 호스트에 대한 새 인증서를 생성 및 배포한 다음 새 호스트에서만 구성 플레이북을 실행합니다. scaleup.yml 플레이북을 실행하기 전에 사전 요구 사항 호스트 준비 단계를 모두 완료합니다.
scaleup.yml 플레이북은 새 호스트만 구성합니다. 마스터 서비스에서 NO_PROXY 를 업데이트하지 않으며 마스터 서비스를 다시 시작하지 않습니다.
scaleup.yml 플레이북을 실행하려면 현재 클러스터 구성을 나타내는 기존 인벤토리 파일(예: /etc/ansible/hosts )이 있어야 합니다. 이전에 atomic-openshift-installer
명령을 사용하여 설치를 실행하는 경우 설치 프로그램에서 생성한 마지막 인벤토리 파일의 ~/.config/openshift/hosts 를 확인하고 해당 파일을 인벤토리 파일로 사용할 수 있습니다. 필요에 따라 이 파일을 수정할 수 있습니다. 그런 다음 ansible-playbook
을 실행할 때 -i
를 사용하여 파일 위치를 지정해야 합니다.
권장되는 최대 노드 수는 클러스터 최대값 섹션을 참조하십시오.
절차
openshift-ansible 패키지를 업데이트하여 최신 플레이북이 있는지 확인합니다.
# yum update openshift-ansible
/etc/ansible/hosts 파일을 편집하고 new_<host_type> 을 [OSEv3:children] 섹션에 추가합니다. 예를 들어 새 노드 호스트를 추가하려면 new_nodes 를 추가합니다.
[OSEv3:children] masters nodes new_nodes
새 마스터 호스트를 추가하려면 new_masters 를 추가합니다.
[new_<host_type>] 섹션을 생성하여 새 호스트에 대한 호스트 정보를 지정합니다. 새 노드 추가의 다음 예에 표시된 대로 이 섹션을 기존 섹션처럼 포맷합니다.
[nodes] master[1:3].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes] node3.example.com openshift_node_group_name='node-config-infra'
자세한 옵션은 호스트 변수 구성을 참조하십시오.
새 마스터 호스트를 추가할 때 [new_masters] 섹션과 [new_nodes] 섹션 모두에 호스트를 추가하여 새 마스터 호스트가 OpenShift SDN의 일부인지 확인합니다.
[masters] master[1:2].example.com [new_masters] master3.example.com [nodes] master[1:2].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes] master3.example.com
중요node-role.kubernetes.io/infra=true
레이블을 사용하여 마스터 호스트에 레이블을 지정하고 다른 전용 인프라 노드가 없는 경우, 항목에openshift_schedulable=true
를 추가하여 호스트를 예약 가능으로 명시적으로 표시해야 합니다. 그렇지 않으면 레지스트리 및 라우터 포드를 아무 위치에 배치할 수 없습니다.플레이북 디렉터리로 변경하고 openshift_node_group.yml 플레이북을 실행합니다. 인벤토리 파일이 기본값 /etc/ansible/hosts 이외의 위치에 있는 경우
-i
옵션을 사용하여 위치를 지정합니다.$ cd /usr/share/ansible/openshift-ansible $ ansible-playbook [-i /path/to/file] \ playbooks/openshift-master/openshift_node_group.yml
이렇게 하면 새 노드 그룹에 대한 ConfigMap이 생성되고 궁극적으로 호스트에서 노드의 구성 파일이 생성됩니다.
참고openshift_node_group.yaml 플레이북을 실행하면 새 노드만 업데이트됩니다. 클러스터의 기존 노드를 업데이트하기 위해 실행할 수 없습니다.
scaleup.yml 플레이북을 실행합니다. 인벤토리 파일이 기본값 /etc/ansible/hosts 이외의 위치에 있는 경우
-i
옵션을 사용하여 위치를 지정합니다.추가 노드의 경우 다음을 수행합니다.
$ ansible-playbook [-i /path/to/file] \ playbooks/openshift-node/scaleup.yml
추가 마스터의 경우 다음을 수행합니다.
$ ansible-playbook [-i /path/to/file] \ playbooks/openshift-master/scaleup.yml
클러스터에 EFK 스택을 배포한 경우 node 레이블을
logging-infra-fluentd=true
로 설정합니다.# oc label node/new-node.example.com logging-infra-fluentd=true
- 플레이북이 실행된 후 설치를 확인합니다.
[new_<host_type>] 섹션에서 정의한 호스트를 적절한 섹션으로 이동합니다. 이러한 호스트를 이동하면 이 인벤토리 파일을 사용하는 후속 플레이북 실행에서 노드를 올바르게 처리합니다. [new_<host_type>] 섹션은 비어 있습니다. 예를 들어 새 노드를 추가할 때 다음을 수행합니다.
[nodes] master[1:3].example.com node1.example.com openshift_node_group_name='node-config-compute' node2.example.com openshift_node_group_name='node-config-compute' node3.example.com openshift_node_group_name='node-config-compute' infra-node1.example.com openshift_node_group_name='node-config-infra' infra-node2.example.com openshift_node_group_name='node-config-infra' [new_nodes]
4.3. etcd 확장
etcd 호스트에 리소스를 추가하여 etcd 클러스터를 수직으로 확장하거나 etcd 호스트를 더 추가하여 수평으로 확장할 수 있습니다.
투표 시스템 etcd 용도 때문에 클러스터에는 항상 홀수의 멤버가 있어야 합니다.
홀수의 etcd 호스트가 포함된 클러스터가 있으면 내결함성이 있는 것입니다. 홀수의 etcd 호스트가 있으면 쿼럼에 필요한 수는 달라지지 않지만 내결함성이 증가합니다. 예를 들어, 멤버가 3개인 클러스터의 경우 쿼럼은 2이므로 내결함성은 1입니다. 따라서 두 멤버가 정상이면 클러스터가 계속 작동합니다.
3개의 etcd 호스트가 있는 프로덕션 내 클러스터를 사용하는 것이 좋습니다.
새로운 호스트에는 새로운 Red Hat Enterprise Linux 버전 7 전용 호스트가 필요합니다. etcd 스토리지가 최대 성능을 발휘하려면 SSD 디스크 및 /var/lib/etcd
에 마운트된 전용 디스크에 있어야 합니다.
전제 조건
- 새 etcd 호스트를 추가하기 전에 etcd 구성 및 데이터를 모두 백업하여 데이터 손실을 방지하십시오.
비정상 클러스터에 새 호스트를 추가하지 않도록 현재 etcd 클러스터 상태를 확인하십시오. 다음 명령을 실행하십시오.
# ETCDCTL_API=3 etcdctl --cert="/etc/etcd/peer.crt" \ --key=/etc/etcd/peer.key \ --cacert="/etc/etcd/ca.crt" \ --endpoints="https://*master-0.example.com*:2379,\ https://*master-1.example.com*:2379,\ https://*master-2.example.com*:2379" endpoint health https://master-0.example.com:2379 is healthy: successfully committed proposal: took = 5.011358ms https://master-1.example.com:2379 is healthy: successfully committed proposal: took = 1.305173ms https://master-2.example.com:2379 is healthy: successfully committed proposal: took = 1.388772ms
scaleup
플레이북을 실행하기 전에 새 호스트가 적절한 Red Hat 소프트웨어 채널에 등록되어 있는지 확인하십시오.# subscription-manager register \ --username=*<username>* --password=*<password>* # subscription-manager attach --pool=*<poolid>* # subscription-manager repos --disable="*" # subscription-manager repos \ --enable=rhel-7-server-rpms \ --enable=rhel-7-server-extras-rpms
etcd는
rhel-7-server-extras-rpms
소프트웨어 채널에서 호스팅됩니다.사용되지 않은 모든 etcd 멤버가 etcd 클러스터에서 제거되었는지 확인하십시오.
scaleup
플레이북을 실행하기 전에 완료해야 합니다.etcd 멤버를 나열하십시오.
# etcdctl --cert="/etc/etcd/peer.crt" --key="/etc/etcd/peer.key" \ --cacert="/etc/etcd/ca.crt" --endpoints=ETCD_LISTEN_CLIENT_URLS member list -w table
해당되는 경우, 사용되지 않은 etcd 멤버 ID를 복사하십시오.
다음 명령에서 ID를 지정하여 사용되지 않은 멤버를 제거하십시오.
# etcdctl --cert="/etc/etcd/peer.crt" --key="/etc/etcd/peer.key" \ --cacert="/etc/etcd/ca.crt" --endpoints=ETCD_LISTEN_CLIENT_URL member remove UNUSED_ETCD_MEMBER_ID
현재 etcd 노드에서 etcd 및 iptables를 업그레이드하십시오.
# yum update etcd iptables-services
- etcd 호스트의 /etc/etcd 구성을 백업하십시오.
- 새 etcd 멤버도 OpenShift Container Platform 노드이면 원하는 수의 호스트를 클러스터에 추가하십시오.
- 이 프로시저의 나머지 부분에서는 호스트를 한 개 추가했다고 가정하지만, 여러 호스트를 추가하는 경우 각 호스트에서 모든 단계를 수행하십시오.
4.3.1. Ansible을 사용하여 새 etcd 호스트 추가
프로시저
Ansible 인벤토리 파일에서
[new_etcd]
라는 새 그룹을 생성하고 새 호스트를 추가하십시오. 그런 다음new_etcd
그룹을[OSEv3]
그룹의 하위 그룹으로 추가하십시오.[OSEv3:children] masters nodes etcd new_etcd 1 ... [OUTPUT ABBREVIATED] ... [etcd] master-0.example.com master-1.example.com master-2.example.com [new_etcd] 2 etcd0.example.com 3
참고이전
etcd 호스트
항목을 인벤토리 파일의 새etcd 호스트
항목으로 교체합니다. 이전etcd 호스트
를 교체하는 동안/etc/etcd/ca/
디렉터리 사본을 생성해야 합니다. 또는 etcd호스트
를 확장하기 전에 etcd ca 및 certs를 재배포할 수 있습니다.OpenShift Container Platform이 설치되어 있고 Ansible 인벤토리 파일을 호스팅하는 호스트에서 플레이북 디렉터리로 이동하여 etcd
scaleup
플레이북을 실행하십시오.$ cd /usr/share/ansible/openshift-ansible $ ansible-playbook playbooks/openshift-etcd/scaleup.yml
플레이북을 실행한 다음 새 etcd 호스트를
[new_etcd]
그룹에서[etcd]
그룹으로 이동하여 현재 상태에 맞게 인벤토리 파일을 수정하십시오.[OSEv3:children] masters nodes etcd new_etcd ... [OUTPUT ABBREVIATED] ... [etcd] master-0.example.com master-1.example.com master-2.example.com etcd0.example.com
Flannel을 사용하는 경우 새 etcd 호스트를 포함하도록
/etc/sysconfig/flanneld
에 있는 모든 OpenShift Container Platform 호스트에서flanneld
서비스 구성을 수정하십시오.FLANNEL_ETCD_ENDPOINTS=https://master-0.example.com:2379,https://master-1.example.com:2379,https://master-2.example.com:2379,https://etcd0.example.com:2379
flanneld
서비스를 다시 시작하십시오.# systemctl restart flanneld.service
4.3.2. 새 etcd 호스트 수동 추가
마스터 노드에서 etcd를 정적 포드로 실행하지 않으면 다른 etcd 호스트를 추가해야 할 수도 있습니다.
프로시저
현재 etcd 클러스터 수정
etcd 인증서를 생성하려면 값을 사용자 환경의 값으로 교체하여 openssl
명령을 실행하십시오.
다음과 같이 일부 환경 변수를 생성하십시오.
export NEW_ETCD_HOSTNAME="*etcd0.example.com*" export NEW_ETCD_IP="192.168.55.21" export CN=$NEW_ETCD_HOSTNAME export SAN="IP:${NEW_ETCD_IP}, DNS:${NEW_ETCD_HOSTNAME}" export PREFIX="/etc/etcd/generated_certs/etcd-$CN/" export OPENSSLCFG="/etc/etcd/ca/openssl.cnf"
참고etcd_v3_ca_*
로 사용되는 사용자 정의openssl
확장에는 $SAN 환경 변수가subjectAltName
으로 포함됩니다. 자세한 내용은/etc/etcd/ca/openssl.cnf
를 참조하십시오.구성 및 인증서를 저장할 디렉터리를 생성하십시오.
# mkdir -p ${PREFIX}
서버 인증서 요청을 생성하고 서명하십시오(server.csr 및 server.crt).
# openssl req -new -config ${OPENSSLCFG} \ -keyout ${PREFIX}server.key \ -out ${PREFIX}server.csr \ -reqexts etcd_v3_req -batch -nodes \ -subj /CN=$CN # openssl ca -name etcd_ca -config ${OPENSSLCFG} \ -out ${PREFIX}server.crt \ -in ${PREFIX}server.csr \ -extensions etcd_v3_ca_server -batch
피어 인증서 요청을 생성하고 서명하십시오(peer.csr 및 peer.crt).
# openssl req -new -config ${OPENSSLCFG} \ -keyout ${PREFIX}peer.key \ -out ${PREFIX}peer.csr \ -reqexts etcd_v3_req -batch -nodes \ -subj /CN=$CN # openssl ca -name etcd_ca -config ${OPENSSLCFG} \ -out ${PREFIX}peer.crt \ -in ${PREFIX}peer.csr \ -extensions etcd_v3_ca_peer -batch
나중에 수정하기 위해 현재 노드의 현재 etcd 구성 및
ca.crt
파일을 예제로 복사하십시오.# cp /etc/etcd/etcd.conf ${PREFIX} # cp /etc/etcd/ca.crt ${PREFIX}
아직 남아 있는 etcd 호스트에서 새 호스트를 클러스터에 추가하십시오. 클러스터에 etcd 멤버를 추가하려면 먼저 첫 번째 멤버의
peerURLs
값에서 기본 localhost 피어를 조정해야 합니다.member list
명령을 사용하여 첫 번째 멤버의 멤버 ID를 가져오십시오.# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://172.18.1.18:2379,https://172.18.9.202:2379,https://172.18.0.75:2379" \ 1 member list
- 1
--peers
매개변수 값에 활성 etcd 멤버의 URL만 지정하십시오.
etcd가 클러스터 피어를 청취하는 IP 주소를 확보하십시오.
$ ss -l4n | grep 2380
멤버 ID와 이전 단계에서 얻은 IP 주소를 전달하여
etcdctl member update
명령으로peerURLs
의 값을 업데이트하십시오.# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://172.18.1.18:2379,https://172.18.9.202:2379,https://172.18.0.75:2379" \ member update 511b7fb6cc0001 https://172.18.1.18:2380
-
member list
명령을 다시 실행하고 피어 URL에 더 이상 localhost가 포함되지 않도록 하십시오.
새 호스트를 etcd 클러스터에 추가하십시오. 새 호스트는 아직 구성되지 않았으므로 새 호스트를 구성할 때까지 상태는
unstarted
로 남아 있습니다.주의각 멤버를 추가하고 한 번에 하나씩 온라인 상태로 만들어야 합니다. 각 멤버를 클러스터에 추가할 때 현재 피어의
peerURL
목록을 조정해야 합니다.peerURL
목록은 각 멤버가 추가될 때마다 하나씩 늘어납니다.etcdctl member add
명령은 다음 지침에 설명된 대로 각 멤버를 추가할 때 etcd.conf 파일에 설정해야 하는 값을 출력합니다.# etcdctl -C https://${CURRENT_ETCD_HOST}:2379 \ --ca-file=/etc/etcd/ca.crt \ --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key member add ${NEW_ETCD_HOSTNAME} https://${NEW_ETCD_IP}:2380 1 Added member named 10.3.9.222 with ID 4e1db163a21d7651 to cluster ETCD_NAME="<NEW_ETCD_HOSTNAME>" ETCD_INITIAL_CLUSTER="<NEW_ETCD_HOSTNAME>=https://<NEW_HOST_IP>:2380,<CLUSTERMEMBER1_NAME>=https:/<CLUSTERMEMBER2_IP>:2380,<CLUSTERMEMBER2_NAME>=https:/<CLUSTERMEMBER2_IP>:2380,<CLUSTERMEMBER3_NAME>=https:/<CLUSTERMEMBER3_IP>:2380" ETCD_INITIAL_CLUSTER_STATE="existing"
- 1
- 이 라인에서
10.3.9.222
는 etcd 멤버의 레이블입니다. 호스트 이름, IP 주소 또는 간단한 이름을 지정할 수 있습니다.
샘플
${PREFIX}/etcd.conf
파일을 업데이트하십시오.다음 값을 이전 단계에서 생성된 값으로 교체하십시오.
- ETCD_NAME
- ETCD_INITIAL_CLUSTER
- ETCD_INITIAL_CLUSTER_STATE
이전 단계의 출력에서 얻은 새 호스트 IP로 다음 변수를 수정하십시오.
${NEW_ETCD_IP}
를 값으로 사용할 수 있습니다.ETCD_LISTEN_PEER_URLS ETCD_LISTEN_CLIENT_URLS ETCD_INITIAL_ADVERTISE_PEER_URLS ETCD_ADVERTISE_CLIENT_URLS
- 이전에 멤버 시스템을 etcd 노드로 사용한 경우 /etc/etcd/etcd.conf 파일에서 현재 값을 덮어써야 합니다.
구문 오류 또는 누락된 IP 주소가 있는지 파일을 확인하십시오. 그렇지 않으면 etcd 서비스가 실패할 수 있습니다.
# vi ${PREFIX}/etcd.conf
-
설치 파일을 호스팅하는 노드에서 /etc/ansible/hosts 인벤토리 파일의
[etcd]
호스트 그룹을 업데이트하십시오. 이전 etcd 호스트를 제거하고 새 호스트를 추가하십시오. 인증서, 샘플 구성 파일 및
ca
가 포함된tgz
파일을 생성하여 새 호스트에 복사하십시오.# tar -czvf /etc/etcd/generated_certs/${CN}.tgz -C ${PREFIX} . # scp /etc/etcd/generated_certs/${CN}.tgz ${CN}:/tmp/
새 etcd 호스트 수정
iptables-services
를 설치하여 etcd의 필수 포트를 여는 iptables 유틸리티를 제공하십시오.# yum install -y iptables-services
etcd가 통신할 수 있도록
OS_FIREWALL_ALLOW
방화벽 규칙을 생성하십시오.- 클라이언트용 2379/tcp 포트
피어 통신용 2380/tcp 포트
# systemctl enable iptables.service --now # iptables -N OS_FIREWALL_ALLOW # iptables -t filter -I INPUT -j OS_FIREWALL_ALLOW # iptables -A OS_FIREWALL_ALLOW -p tcp -m state --state NEW -m tcp --dport 2379 -j ACCEPT # iptables -A OS_FIREWALL_ALLOW -p tcp -m state --state NEW -m tcp --dport 2380 -j ACCEPT # iptables-save | tee /etc/sysconfig/iptables
참고이 예에서는 새 체인
OS_FIREWALL_ALLOW
가 생성되는데, 이는 OpenShift Container Platform 설치 프로그램이 방화벽 규칙에 사용하는 표준 이름입니다.주의IaaS 환경에서 사용자 환경을 호스팅하는 경우 해당 포트로 들어오는 트래픽도 허용하도록 인스턴스의 보안 그룹을 수정하십시오.
etcd를 설치하십시오.
# yum install -y etcd
버전
etcd-2.3.7-4.el7.x86_64
이상이 설치되어 있는지 확인하십시오.etcd 포드 정의를 제거하여 etcd 서비스가 실행 중이지 않은지 확인하십시오.
# mkdir -p /etc/origin/node/pods-stopped # mv /etc/origin/node/pods/* /etc/origin/node/pods-stopped/
etcd 구성 및 데이터를 제거하십시오.
# rm -Rf /etc/etcd/* # rm -Rf /var/lib/etcd/*
인증서 및 구성 파일을 추출하십시오.
# tar xzvf /tmp/etcd0.example.com.tgz -C /etc/etcd/
새 호스트에서 etcd를 시작하십시오.
# systemctl enable etcd --now
호스트가 클러스터의 일부인지 확인하고 현재 클러스터 상태를 점검하십시오.
v2 etcd API를 사용하는 경우 다음 명령을 실행하십시오.
# etcdctl --cert-file=/etc/etcd/peer.crt \ --key-file=/etc/etcd/peer.key \ --ca-file=/etc/etcd/ca.crt \ --peers="https://*master-0.example.com*:2379,\ https://*master-1.example.com*:2379,\ https://*master-2.example.com*:2379,\ https://*etcd0.example.com*:2379"\ cluster-health member 5ee217d19001 is healthy: got healthy result from https://192.168.55.12:2379 member 2a529ba1840722c0 is healthy: got healthy result from https://192.168.55.8:2379 member 8b8904727bf526a5 is healthy: got healthy result from https://192.168.55.21:2379 member ed4f0efd277d7599 is healthy: got healthy result from https://192.168.55.13:2379 cluster is healthy
v3 etcd API를 사용하는 경우 다음 명령을 실행하십시오.
# ETCDCTL_API=3 etcdctl --cert="/etc/etcd/peer.crt" \ --key=/etc/etcd/peer.key \ --cacert="/etc/etcd/ca.crt" \ --endpoints="https://*master-0.example.com*:2379,\ https://*master-1.example.com*:2379,\ https://*master-2.example.com*:2379,\ https://*etcd0.example.com*:2379"\ endpoint health https://master-0.example.com:2379 is healthy: successfully committed proposal: took = 5.011358ms https://master-1.example.com:2379 is healthy: successfully committed proposal: took = 1.305173ms https://master-2.example.com:2379 is healthy: successfully committed proposal: took = 1.388772ms https://etcd0.example.com:2379 is healthy: successfully committed proposal: took = 1.498829ms
각 OpenShift Container Platform 마스터 수정
모든 마스터에서
/etc/origin/master/master-config.yaml
파일의etcClientInfo
섹션에서 마스터 구성을 수정하십시오. OpenShift Container Platform에서 데이터를 저장하는 데 사용하는 etcd 서버 목록에 새 etcd 호스트를 추가하고 실패한 etcd 호스트를 제거하십시오.etcdClientInfo: ca: master.etcd-ca.crt certFile: master.etcd-client.crt keyFile: master.etcd-client.key urls: - https://master-0.example.com:2379 - https://master-1.example.com:2379 - https://master-2.example.com:2379 - https://etcd0.example.com:2379
마스터 API 서비스를 다시 시작하십시오.
모든 마스터에서 다음을 수행하십시오.
# master-restart api # master-restart controllers
주의etcd 노드의 수는 홀수여야 하므로 2개 이상의 호스트를 추가해야 합니다.
Flannel을 사용하는 경우 새 etcd 호스트를 포함하도록 모든 OpenShift Container Platform 호스트에서
/etc/sysconfig/flanneld
에 있는flanneld
서비스 구성을 수정하십시오.FLANNEL_ETCD_ENDPOINTS=https://master-0.example.com:2379,https://master-1.example.com:2379,https://master-2.example.com:2379,https://etcd0.example.com:2379
flanneld
서비스를 다시 시작하십시오.# systemctl restart flanneld.service
5장. 사용자 관리
5.1. 개요
사용자는 OpenShift Container Platform API와 상호 작용하는 엔터티입니다. 애플리케이션을 개발하기 위한 개발자 또는 클러스터 관리를 위한 관리자일 수 있습니다. 사용자는 그룹에 할당될 수 있으며, 이를 통해 모든 그룹의 구성원에 적용되는 권한을 설정할 수 있습니다. 예를 들어 그룹에 API 액세스 권한을 부여하여 그룹의 모든 멤버에게 API 액세스 권한을 부여할 수 있습니다.
이 주제에서는 OpenShift Container Platform에서 새 사용자 계정을 생성하는 방법과 해당 계정을 삭제하는 방법을 포함하여 사용자 계정 관리에 대해 설명합니다.
5.2. 사용자 생성
사용자를 생성하는 프로세스는 구성된 ID 프로바이더에 따라 다릅니다. 기본적으로 OpenShift Container Platform에서는 모든 사용자 이름 및 암호에 대한 액세스를 거부하는 DenyAll
ID 공급자를 사용합니다.
다음 프로세스는 새 사용자를 생성한 다음 사용자에게 역할을 추가합니다.
-
ID 공급자에 따라 사용자 계정을 생성합니다. 이는 ID 프로바이더 구성의 일부로
사용되는 mapping
메서드에 따라 달라질 수 있습니다. 새 사용자에게 원하는 역할을 제공합니다.
# oc create clusterrolebinding <clusterrolebinding_name> \ --clusterrole=<role> --user=<user>
여기에서
--clusterrole
옵션이 원하는 클러스터 역할입니다. 예를 들어 클러스터 내의 모든 항목에 대한 액세스 권한을 제공하는 새 사용자에게cluster-admin
권한을 부여하려면 다음을 수행합니다.# oc create clusterrolebinding registry-controller \ --clusterrole=cluster-admin --user=admin
역할 설명 및 목록은 아키텍처 가이드의 클러스터 역할 및 로컬 역할 섹션을 참조하십시오.
클러스터 관리자는 각 사용자의 액세스 수준도 관리할 수 있습니다.
ID 프로바이더 및 정의된 그룹 구조에 따라 일부 역할을 사용자에게 자동으로 제공할 수 있습니다. 자세한 내용은 Synching groups with LDAP 섹션을 참조하십시오.
5.3. 사용자 및 ID 목록 보기
OpenShift Container Platform 사용자 구성은 OpenShift Container Platform의 여러 위치에 저장됩니다. ID 공급자에 관계없이 OpenShift Container Platform은 역할 기반 액세스 제어(RBAC) 정보 및 그룹 멤버십과 같은 세부 정보를 내부적으로 저장합니다. 사용자 정보를 완전히 제거하려면 사용자 계정 외에 이 데이터를 제거해야 합니다.
OpenShift Container Platform에서 두 가지 오브젝트 유형에는 ID 공급자 외부의 사용자 데이터, 즉 사용자
및 ID
가 포함됩니다.
사용자의 현재 목록을 가져오려면 다음을 수행합니다.
$ oc get user NAME UID FULL NAME IDENTITIES demo 75e4b80c-dbf1-11e5-8dc6-0e81e52cc949 htpasswd_auth:demo
현재 ID 목록을 가져오려면 다음을 수행합니다.
$ oc get identity NAME IDP NAME IDP USER NAME USER NAME USER UID htpasswd_auth:demo htpasswd_auth demo demo 75e4b80c-dbf1-11e5-8dc6-0e81e52cc949
두 오브젝트 유형 간에 일치하는 UID를 확인합니다. OpenShift Container Platform 사용을 시작한 후 인증 공급자를 변경하려는 경우 ID 목록의 항목으로 인해 겹치는 사용자 이름이 작동하지 않습니다. 이 항목은 여전히 이전 인증 방법을 가리킵니다.
5.4. 그룹 생성
사용자는 OpenShift Container Platform에 대한 요청을 수행하는 엔터티이지만 사용자는 일련의 사용자로 구성된 하나 이상의 그룹으로 구성할 수 있습니다. 그룹은 권한 부여 정책과 같이 한 번에 여러 사용자를 관리하거나 여러 사용자에게 한 번에 권한을 부여하는 데 유용합니다.
조직에서 LDAP를 사용하는 경우 한 곳에서 그룹을 구성할 수 있도록 LDAP 레코드를 OpenShift Container Platform에 동기화할 수 있습니다. 이는 사용자에 대한 정보가 LDAP 서버에 있다고 가정합니다. 자세한 내용은 Synching groups with LDAP 섹션을 참조하십시오.
LDAP를 사용하지 않는 경우 다음 절차를 사용하여 수동으로 그룹을 생성할 수 있습니다.
새 그룹을 생성하려면 다음을 수행합니다.
# oc adm groups new <group_name> <user1> <user2>
예를 들어, west
그룹을 생성하고 john
및 betty
사용자를 배치하려면 다음을 수행합니다.
# oc adm groups new west john betty
그룹이 생성되었는지 확인하고 그룹과 연결된 사용자를 나열하려면 다음을 실행합니다.
# oc get groups NAME USERS west john, betty
다음 단계:
5.5. 사용자 및 그룹 레이블 관리
사용자 또는 그룹에 라벨을 추가하려면 다음을 수행합니다.
$ oc label user/<user_name> <label_name>=<label_value>
예를 들어 사용자 이름이 theuser 이고 라벨이 level=gold 인 경우 :
$ oc label user/theuser level=gold
라벨을 제거하려면 다음을 수행합니다.
$ oc label user/<user_name> <label_name>-
사용자 또는 그룹의 라벨을 표시하려면 다음을 수행합니다.
$ oc describe user/<user_name>
5.6. 사용자 삭제
사용자를 삭제하려면 다음을 수행합니다.
사용자 레코드를 삭제합니다.
$ oc delete user demo user "demo" deleted
사용자 ID를 삭제합니다.
사용자의 ID는 사용하는 식별 공급자와 관련이 있습니다.
oc get user
의 사용자 레코드에서 공급자 이름을 가져옵니다.이 예에서 ID 프로바이더 이름은 htpasswd_auth 입니다. 명령은 다음과 같습니다.
# oc delete identity htpasswd_auth:demo identity "htpasswd_auth:demo" deleted
이 단계를 건너뛰면 사용자가 다시 로그인할 수 없습니다.
이러한 단계를 완료하면 사용자가 다시 로그인할 때 OpenShift Container Platform에 새 계정이 생성됩니다.
사용자가 다시 로그인하지 못하도록 하는 의도(예: 직원이 퇴사하고 계정을 영구적으로 삭제하려는 경우) 구성된 ID 프로바이더에 대한 인증 백엔드(예: htpasswd,kerberos 또는 기타)에서 사용자를 제거할 수도 있습니다.
예를 들어 htpasswd 를 사용하는 경우 사용자 이름과 암호가 있는 OpenShift Container Platform에 구성된 htpasswd 파일에서 항목을 삭제합니다.
LDAP(Lightweight Directory Access Protocol) 또는 Red Hat IdM(Identity Management)과 같은 외부 식별 관리의 경우 사용자 관리 도구를 사용하여 사용자 항목을 제거합니다.
6장. 프로젝트 관리
6.1. 개요
OpenShift Container Platform에서 프로젝트는 관련 오브젝트를 그룹화하고 격리하는 데 사용됩니다. 관리자는 개발자에게 특정 프로젝트에 대한 액세스 권한을 부여하고 자체 프로젝트를 만들 수 있도록 허용하며 개별 프로젝트 내에서 관리 권한을 부여할 수 있습니다.
6.2. 자체 프로비저닝 프로젝트
개발자가 자신의 프로젝트를 만들 수 있도록 허용할 수 있습니다. 템플릿에 따라 프로젝트를 프로비저닝할 엔드포인트가 있습니다 . 개발자가 새 프로젝트를 생성할 때 웹 콘솔 및 oc new-project
명령은 이 엔드포인트를 사용합니다.
6.2.1. 새 프로젝트의 템플릿 수정
API 서버는 master-config.yaml 파일의 projectRequestTemplate
매개 변수로 식별된 템플릿을 기반으로 프로젝트를 자동으로 프로비저닝합니다. 매개 변수가 정의되지 않은 경우 API 서버는 요청된 이름으로 프로젝트를 생성하는 기본 템플릿을 생성하고 요청하는 사용자를 해당 프로젝트의 "admin" 역할에 할당합니다.
사용자 정의 프로젝트 템플릿을 만들려면:
현재 기본 프로젝트 템플릿으로 시작합니다.
$ oc adm create-bootstrap-project-template -o yaml > template.yaml
- 텍스트 편집기를 사용하여 오브젝트를 추가하거나 기존 오브젝트를 수정하여 template.yaml 파일을 수정합니다.
템플릿을 로드합니다.
$ oc create -f template.yaml -n default
로드된 템플릿을 참조하도록 master-config.yaml 파일을 수정합니다.
... projectConfig: projectRequestTemplate: "default/project-request" ...
프로젝트 요청을 제출하면 API에서 다음 매개변수를 템플릿으로 대체합니다.
매개변수 | 설명 |
---|---|
PROJECT_NAME | 프로젝트 이름입니다. 필수 항목입니다. |
PROJECT_DISPLAYNAME | 프로젝트의 표시 이름입니다. 비어 있을 수 있습니다. |
PROJECT_DESCRIPTION | 프로젝트에 대한 설명입니다. 비어 있을 수 있습니다. |
PROJECT_ADMIN_USER | 관리 사용자의 사용자 이름. |
PROJECT_REQUESTING_USER | 요청하는 사용자의 사용자 이름. |
API에 대한 액세스 권한은 self-provisioner 역할 및
클러스터 역할 바인딩을 사용하여 개발자에게 부여됩니다. 이 역할은 기본적으로 인증된 모든 개발자에게 제공됩니다.
self-provisioner
s
6.2.2. 셀프 프로비저닝 비활성화
인증된 사용자 그룹이 새 프로젝트를 자체 프로비저닝하지 못하도록 할 수 있습니다.
- cluster-admin 권한이 있는 사용자로 로그인합니다.
self-provisioners
clusterrolebinding 사용을 검토합니다. 다음 명령을 실행한 다음self-provisioners
섹션의 제목을 검토합니다.$ oc describe clusterrolebinding.rbac self-provisioners Name: self-provisioners Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: self-provisioner Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated:oauth
그룹
system:authenticated:oauth
에서self-provisioner
클러스터 역할을 제거합니다.self-provisioners
클러스터 역할 바인딩에서self-provisioner
역할을system:authenticated:oauth
그룹에만 바인딩하는 경우 다음 명령을 실행합니다.$ oc patch clusterrolebinding.rbac self-provisioners -p '{"subjects": null}'
self-provisioners cluster
rolebinding에서self-provisioner 역할을 system
:authenticated:oauth
그룹보다 더 많은 사용자, 그룹 또는 serviceaccounts에 바인딩하는 경우 다음 명령을 실행합니다.$ oc adm policy remove-cluster-role-from-group self-provisioner system:authenticated:oauth
master-config.yaml 파일에서
projectRequestMessage
매개변수 값을 설정하여 개발자에게 새 프로젝트를 요청하는 방법을 지시합니다. 이 매개 변수 값은 사용자가 프로젝트를 자체 프로비저닝하려고 할 때 웹 콘솔 및 명령줄에 있는 사용자에게 제공되는 문자열입니다. 다음 메시지 중 하나를 사용할 수 있습니다.-
프로젝트를 요청하려면
projectname@example.com
을 통해 시스템 관리자에게 문의하십시오. -
새 프로젝트를 요청하려면
https://internal.example.com/openshift-project-request
에 있는 프로젝트 요청 양식을 작성합니다.
YAML 파일 예
... projectConfig: ProjectRequestMessage: "message" ...
-
프로젝트를 요청하려면
역할이 자동으로 업데이트되지 않도록
self-provisioners
클러스터 역할 바인딩을 편집합니다. 역할이 자동으로 업데이트되면 클러스터 역할이 기본 상태로 재설정됩니다.명령줄에서 역할 바인딩을 업데이트하려면 다음을 수행합니다.
다음 명령을 실행합니다.
$ oc edit clusterrolebinding.rbac self-provisioners
표시된 역할 바인딩에서 다음 예와 같이
rbac.authorization.kubernetes.io/autoupdate
매개변수 값을false
로 설정합니다.apiVersion: authorization.openshift.io/v1 kind: ClusterRoleBinding metadata: annotations: rbac.authorization.kubernetes.io/autoupdate: "false" ...
단일 명령을 사용하여 역할 바인딩을 업데이트하려면 다음을 실행합니다.
$ oc patch clusterrolebinding.rbac self-provisioners -p '{ "metadata": { "annotations": { "rbac.authorization.kubernetes.io/autoupdate": "false" } } }'
6.3. 노드 선택기 사용
노드 선택기는 포드 배치를 제어하기 위해 레이블이 지정된 노드와 함께 사용됩니다.
6.3.1. 클러스터 전체 기본 노드 선택기 설정
클러스터 관리자는 Pod 배치를 특정 노드로 제한하도록 클러스터 수준 기본 노드 선택기를 설정할 수 있습니다.
/etc/origin/master/master-config.yaml 에서 마스터 구성 파일을 편집하고 기본 노드 선택기의 값을 추가합니다. 이는 지정된 nodeSelector
값이 없는 모든 프로젝트에서 생성된 Pod에 적용됩니다.
... projectConfig: defaultNodeSelector: "type=user-node,region=east" ...
변경 사항을 적용하려면 OpenShift 서비스를 다시 시작하십시오.
# master-restart api # master-restart controllers
6.3.2. 프로젝트 전체 노드 선택기 설정
노드 선택기를 사용하여 개별 프로젝트를 생성하려면 프로젝트를 생성할 때 --node-selector
옵션을 사용합니다. 예를 들어 여러 리전이 있는 OpenShift Container Platform 토폴로지가 있는 경우 노드 선택기를 사용하여 특정 OpenShift Container Platform 프로젝트를 특정 리전의 노드에만 배포하도록 제한할 수 있습니다.
다음은 myproject
라는 새 프로젝트를 생성하고 사용자 노드 및
east
라는 레이블이 지정된 노드에 포드를 배포함을 나타냅니다.
$ oc adm new-project myproject \ --node-selector='type=user-node,region=east'
이 명령이 실행되면 지정된 프로젝트에 포함된 모든 포드의 관리자 세트 노드 선택기가 됩니다.
new-project
하위 명령은 oc adm 및 oc
모두에 사용할 수 있지만 각각 클러스터 관리자 및 developer 명령에는 노드 선택기를 사용하여 새 프로젝트를 생성하는 것은
oc adm
명령만 사용할 수 있습니다. 프로젝트를 자체 프로비저닝하는 경우 new-project
하위 명령은 프로젝트 개발자에게 제공되지 않습니다.
oc adm new-project
명령을 사용하면 주석
섹션이 프로젝트에 추가됩니다. 프로젝트를 편집하고 openshift.io/node-selector
값을 변경하여 기본값을 재정의할 수 있습니다.
... metadata: annotations: openshift.io/node-selector: type=user-node,region=east ...
다음 명령을 사용하여 기존 프로젝트 네임스페이스에 대한 기본값을 재정의할 수도 있습니다.
# oc patch namespace myproject -p \ '{"metadata":{"annotations":{"openshift.io/node-selector":"node-role.kubernetes.io/infra=true"}}}'
openshift.io/node-selector
가 빈 문자열(ocadm new-project --node-selector="")로 설정된 경우 클러스터 전체 기본값이 설정된 경우에도 프로젝트에
관리자 설정 노드 선택기가 없습니다. 즉, 클러스터 관리자로서 개발자 프로젝트를 노드의 하위 집합으로 제한하고 인프라 또는 기타 프로젝트에서 전체 클러스터를 예약할 수 있도록 기본값을 설정할 수 있습니다.
6.3.3. 개발자 지정 노드 선택기
OpenShift Container Platform 개발자는 노드를 추가로 제한하려는 경우 Pod 구성에 노드 선택기를 설정 할 수 있습니다. 이는 프로젝트 노드 선택기 외에도 노드 선택기 값이 있는 모든 프로젝트의 노드 선택기 값을 지정할 수 있습니다.
예를 들어 위의 주석(openshift.io/node-selector: type=user-node,region=east
)을 사용하여 프로젝트가 생성되고 개발자가 해당 프로젝트의 Pod에 다른 노드 선택기를 설정합니다(예: =classified
) Pod는 세 개의 라벨(type=user-node,
region=east
, parcel=classified
)이 모두 있는 노드에만 예약됩니다. 포드에서 region=west
을 설정하면 포드가 region =east 및
레이블이 있는 노드가 요구되며 작동하지 않습니다. 레이블을 하나의 값으로만 설정할 수 있으므로 포드는 예약되지 않습니다.
region=
west
6.4. 사용자당 자체 프로비저닝 프로젝트 수 제한
지정된 사용자가 요청한 자체 프로비저닝 프로젝트 수는 ProjectRequestLimit
승인 제어 플러그인으로 제한할 수 있습니다.
프로젝트 요청 템플릿이 OpenShift Container Platform 3.1 또는 이전 버전에서 New Projects 템플릿 수정에 설명된 프로세스를 사용하여 생성된 경우, 생성된 템플릿에는 ProjectRequestLimitConfig
에 사용되는 주석 openshift.io/requester: ${PROJECT_REQUESTING_USER}
이(가) 포함되지 않습니다. 주석을 추가해야 합니다.
사용자에 대한 제한을 지정하려면 /etc/origin/master/master-config.yaml 의 마스터 구성 파일 내의 플러그인에 대한 구성을 지정해야 합니다. 플러그인 구성은 사용자 레이블 선택기 및 연결된 최대 프로젝트 요청 목록을 가져옵니다.
선택기는 순서대로 평가됩니다. 현재 사용자와 일치하는 첫 번째 사용자가 최대 프로젝트 수를 결정하는 데 사용됩니다. 선택기를 지정하지 않으면 제한이 모든 사용자에게 적용됩니다. 최대 프로젝트 수를 지정하지 않으면 특정 선택기에 대해 무제한의 프로젝트가 허용됩니다.
다음 구성에서는 사용자당 프로젝트 2개로 전역 제한을 설정하며 level=admin이라는 레이블이 있는 사용자에 대해 10개의 프로젝트를 허용하고, 무제한
프로젝트는 level=admin
입니다.
admissionConfig: pluginConfig: ProjectRequestLimit: configuration: apiVersion: v1 kind: ProjectRequestLimitConfig limits: - selector: level: admin 1 - selector: level: advanced 2 maxProjects: 10 - maxProjects: 2 3
사용자 및 그룹 레이블 관리는 사용자와 그룹에 레이블을 추가, 제거 또는 표시하는 방법에 대한 지침을 제공합니다.
변경 사항이 완료되면 OpenShift Container Platform을 다시 시작하여 변경 사항을 적용합니다.
# master-restart api # master-restart controllers
6.5. 서비스 계정별로 자체 프로비저닝 프로젝트 활성화 및 제한
기본적으로 서비스 계정은 프로젝트를 생성할 수 없습니다. 그러나 관리자는 서비스 계정당 이 기능을 활성화할 수 있으며, 지정된 서비스 계정에서 요청한 자체 프로비저닝 프로젝트 수는 ProjectRequestLimit
승인 제어 플러그인으로 제한할 수 있습니다.
서비스 계정이 프로젝트를 생성할 수 있는 경우 프로젝트 편집기에서 해당 레이블을 조작할 수 있으므로 해당 계정에 배치된 레이블을 신뢰할 수 없습니다.
프로젝트에 서비스 계정이 없는 경우 해당 계정을 생성합니다.
$ oc create sa <sa_name>
cluster-admin
권한이 있는 사용자로 서비스 계정에self-provisioner
클러스터 역할을 추가합니다.$ oc adm policy \ add-cluster-role-to-user self-provisioner \ system:serviceaccount:<project>:<sa_name>
/etc/origin/master/master-config.yaml 에서 마스터 구성 파일을 편집하고
ProjectRequestLimit
섹션의maxProjectsForServiceAccounts
매개변수 값을 생성할 수 있는 지정된 프로젝트 수로 설정합니다.예를 들어 다음 구성은 서비스 계정당 프로젝트 3개로 글로벌 제한을 설정합니다.
admissionConfig: pluginConfig: ProjectRequestLimit: configuration: apiVersion: v1 kind: ProjectRequestLimitConfig maxProjectsForServiceAccounts: 3
변경 사항을 저장한 후 OpenShift Container Platform을 다시 시작하여 변경 사항을 적용합니다.
# master-restart api # master-restart controllers
서비스 계정으로 로그인하고 새 프로젝트를 생성하여 변경 사항이 적용되었는지 확인합니다.
토큰을 사용하여 서비스 계정으로 로그인합니다.
$ oc login --token <token>
새 프로젝트를 생성합니다.
$ oc new-project <project_name>
7장. Pod 관리
7.1. 개요
이 주제에서는 한 번 실행 기간 제한 및 사용 가능한 대역폭을 비롯하여 Pod 관리에 대해 설명합니다.
7.2. Pod 보기
컨테이너의 런타임 환경을 제공하는 Pod에 대한 사용량 통계를 표시할 수 있습니다. 이러한 사용량 통계에는 CPU, 메모리, 스토리지 사용량이 포함됩니다.
사용량 통계를 보려면 다음을 수행합니다.
$ oc adm top pods NAME CPU(cores) MEMORY(bytes) hawkular-cassandra-1-pqx6l 219m 1240Mi hawkular-metrics-rddnv 20m 1765Mi heapster-n94r4 3m 37Mi
라벨을 사용하여 Pod의 사용량 통계를 보려면 다음을 수행합니다.
$ oc adm top pod --selector=''
필터링할 선택기(라벨 쿼리)를 선택해야 합니다. =
, ==
, !=
가 지원됩니다.
사용량 통계를 보려면 cluster-reader
권한이 있어야 합니다.
사용량 통계를 보려면 metrics-server
를 설치해야 합니다. Horizontal Pod Autoscaler 사용에 대한 요구 사항을 참조하십시오.
7.3. 한 번 실행 Pod 기간 제한
OpenShift Container Platform은 한 번만 실행 Pod를 사용하여 포드 배포 또는 빌드 수행과 같은 작업을 수행합니다. 한 번 실행 Pod는 RestartPolicy
가 Never
또는 OnFailure
인 Pod입니다.
클러스터 관리자는 RunOnceDuration 승인 제어 플러그인을 사용하여 한 번 실행 Pod를 활성화할 수 있는 시간을 제한할 수 있습니다. 시간 제한이 만료되면 클러스터에서 이러한 Pod를 적극적으로 종료하려고 합니다. 이러한 제한이 있는 주된 이유는 빌드와 같은 작업이 과도한 시간 동안 실행되도록 하는 것입니다.
7.3.1. RunOnceDuration 플러그인 구성
플러그인 구성에는 한 번 실행 Pod의 기본 활성 데드라인이 포함되어야 합니다. 이 데드라인은 전역적으로 적용되지만 프로젝트별로 대체될 수 있습니다.
admissionConfig:
pluginConfig:
RunOnceDuration:
configuration:
apiVersion: v1
kind: RunOnceDurationConfig
activeDeadlineSecondsOverride: 3600 1
....
- 1
- 실행 Pod의 글로벌 기본값을 초 단위로 지정합니다.
7.3.2. 프로젝트당 사용자 지정 기간 지정
관리자는 실행 Pod에 대한 글로벌 최대 기간을 지정하는 것 외에도 주석(openshift.io/active-deadline-seconds-override
)을 특정 프로젝트에 추가하여 글로벌 기본값을 재정의할 수 있습니다.
새 프로젝트의 경우 프로젝트 specification .yaml 파일에 주석을 정의합니다.
apiVersion: v1 kind: Project metadata: annotations: openshift.io/active-deadline-seconds-override: "1000" 1 name: myproject
- 1
- 실행 중인 Pod의 기본 활성 종료 시간(초)을 1000초로 재정의합니다. 덮어쓰기 값은 문자열 형식으로 지정해야 합니다.
기존 프로젝트의 경우
oc edit
를 실행하고openshift.io/active-deadline-seconds-override를 추가합니다. 편집기에서 1000
주석.$ oc edit namespace <project-name>
또는
oc patch
명령을 사용합니다.$ oc patch namespace <project_name> -p '{"metadata":{"annotations":{"openshift.io/active-deadline-seconds-override":"1000"}}}'
7.3.2.1. 송신 라우터 Pod 배포
예 7.1. 송신 라우터의 Pod 정의 예
apiVersion: v1 kind: Pod metadata: name: egress-1 labels: name: egress-1 annotations: pod.network.openshift.io/assign-macvlan: "true" spec: containers: - name: egress-router image: openshift3/ose-egress-router securityContext: privileged: true env: - name: EGRESS_SOURCE 1 value: 192.168.12.99 - name: EGRESS_GATEWAY 2 value: 192.168.12.1 - name: EGRESS_DESTINATION 3 value: 203.0.113.25 nodeSelector: site: springfield-1 4
pod.network.openshift.io/assign-macvlan 주석
은 기본 네트워크 인터페이스에서 Macvlan 네트워크 인터페이스를 생성한 다음 egress-router 컨테이너를 시작하기 전에 Pod의 네트워크 네임스페이스로 이동합니다.
"true"
로 따옴표를 보존합니다. 이를 생략하면 오류가 발생합니다.
Pod에는 openshift3/ose-egress-router 이미지를 사용하는 단일 컨테이너가 포함되어 있으며, Macvlan 인터페이스를 구성하고 iptables
규칙을 설정할 수 있도록 해당 컨테이너가 권한이 부여됩니다.
환경 변수는 사용할 주소를 송신 라우터 이미지에 알립니다. EGRESS_ GATEWAY
를 게이트웨이로 사용하여 EGRESS_SOURCE
를 IP 주소로 사용하도록 Macvlan 인터페이스를 구성합니다.
NAT 규칙은 Pod의 클러스터 IP 주소의 TCP 또는 UDP 포트에 대한 연결이 EGRESS_DESTINATION
의 동일한 포트로 리디렉션되도록 설정됩니다.
클러스터의 일부 노드만 지정된 소스 IP 주소를 요청하고 지정된 게이트웨이를 사용할 수 있는 경우 허용 가능한 노드를 나타내는 nodeName
또는 nodeSelector
를 지정할 수 있습니다.
7.3.2.2. 송신 라우터 서비스 배포
반드시 필요한 것은 아니지만 일반적으로 송신 라우터를 가리키는 서비스를 생성하려고 합니다.
apiVersion: v1 kind: Service metadata: name: egress-1 spec: ports: - name: http port: 80 - name: https port: 443 type: ClusterIP selector: name: egress-1
이제 Pod에서 이 서비스에 연결할 수 있습니다. 이러한 연결은 예약된 송신 IP 주소를 사용하여 외부 서버의 해당 포트로 리디렉션됩니다.
7.3.3. 송신 방화벽을 사용하여 Pod 액세스 제한
OpenShift Container Platform 클러스터 관리자는 송신 정책을 사용하여 일부 또는 모든 Pod가 클러스터 내에서 액세스할 수 있는 외부 주소를 제한할 수 있습니다.
포드는 내부 호스트와만 통신할 수 있으며 공용 인터넷에 대한 연결을 시작할 수 없습니다.
또는,
포드는 공용 인터넷 전용으로 통신할 수 있으며 클러스터 외부에서는 내부 호스트 연결을 시작할 수 없습니다.
또는,
- Pod는 연결할 이유가 없어 지정된 내부 서브넷/호스트에 도달할 수 없습니다.
예를 들어 지정된 IP 범위에 대한 <project A> 액세스를 허용하지만 <
에 대한 동일한 액세스를 거부하도록 다양한 송신 정책을 사용하여 프로젝트를 구성할 수 있습니다.
project B>
송신 정책을 통해 Pod 액세스를 제한하려면 ovs-multitenant 플러그인이 활성화되어 있어야 합니다.
프로젝트 관리자는 EgressNetworkPolicy 오브젝트
를 생성하거나 프로젝트에서 생성한 개체를 편집할 수 없습니다. 또한 EgressNetworkPolicy
를 생성할 수 있는 몇 가지 제한 사항이 있습니다.
-
기본
프로젝트(및oc adm pod-network make-projects-global
를 통해 전역적으로 수행된 다른 프로젝트)에는 송신 정책이 없습니다. -
oc adm pod-network join-projects
를 통해 두 개의 프로젝트를 함께 병합하면 결합된 프로젝트에서 송신 정책을 사용할 수 없습니다. - 송신 정책 오브젝트가 두 개 이상일 수 있는 프로젝트는 없습니다.
이러한 제한 사항을 위반하면 프로젝트의 송신 정책이 손상되고 모든 외부 네트워크 트래픽이 삭제될 수 있습니다.
7.3.3.1. Pod 액세스 제한 구성
포드 액세스 제한을 구성하려면 oc
명령 또는 REST API를 사용해야 합니다. oc [create|replace|delete]
를 사용하여 EgressNetworkPolicy 오브젝트
를 조작할 수 있습니다. api/swagger-spec/oapi-v1.json 파일에는 오브젝트의 실제 작동 방식에 대한 API 수준의 세부 정보가 있습니다.
Pod 액세스 제한을 구성하려면 다음을 수행합니다.
- 영향을 미칠 프로젝트로 이동합니다.
Pod 제한 정책에 대한 JSON 파일을 생성합니다.
# oc create -f <policy>.json
정책 세부 정보를 사용하여 JSON 파일을 구성합니다. 예를 들면 다음과 같습니다.
{ "kind": "EgressNetworkPolicy", "apiVersion": "v1", "metadata": { "name": "default" }, "spec": { "egress": [ { "type": "Allow", "to": { "cidrSelector": "1.2.3.0/24" } }, { "type": "Allow", "to": { "dnsName": "www.foo.com" } }, { "type": "Deny", "to": { "cidrSelector": "0.0.0.0/0" } } ] } }
위의 예가 프로젝트에 추가되면 IP 범위
1.2.3.0/24
및 도메인 이름www.foo.com
에 대한 트래픽을 허용하지만 다른 모든 외부 IP 주소에 대한 액세스를 거부합니다. (정책이 외부 트래픽에만 적용되므로 다른 포드에 대한 트래픽은 영향을 받지 않습니다.)EgressNetworkPolicy
의 규칙이 순서대로 확인되고 일치하는 첫 번째 규칙이 적용됩니다. 위 예제의 세 규칙이 되돌리면0.0.0.0/0
규칙이 먼저 확인되므로 트래픽이1.2.3.0/24
및www.foo.com
에 허용되지 않으며 모든 트래픽과 일치하고 거부됩니다.도메인 이름 업데이트가 30분 이내에 반영됩니다. 위의 예에서
www.foo.com
가10.11.12.13
로 해결되었지만 나중에20.21.22.23
으로 변경되었습니다. 그런 다음 OpenShift Container Platform이 이러한 DNS 업데이트에 맞게 조정하는 데 최대 30분이 걸립니다.
7.4. Pod로 사용 가능한 대역폭 제한
Pod에 서비스 품질 트래픽 조절 기능을 적용하고 사용 가능한 대역폭을 효과적으로 제한할 수 있습니다. Pod에서 송신하는 트래픽은 구성된 속도를 초과하는 패킷을 간단히 삭제하는 정책에 따라 처리합니다. Pod에 수신되는 트래픽은 데이터를 효과적으로 처리하기 위해 대기 중인 패킷을 구성하여 처리합니다. 특정 Pod에 대한 제한 사항은 다른 Pod의 대역폭에 영향을 미치지 않습니다.
Pod의 대역폭을 제한하려면 다음을 수행합니다.
오브젝트 정의 JSON 파일을 작성하고
kubernetes.io/ingress-bandwidth
및kubernetes.io/egress-bandwidth
주석을 사용하여 데이터 트래픽 속도를 지정합니다. 예를 들어 Pod 송신 및 수신 대역폭을 둘 다 10M/s로 제한하려면 다음을 수행합니다.제한된 Pod 오브젝트 정의
{ "kind": "Pod", "spec": { "containers": [ { "image": "openshift/hello-openshift", "name": "hello-openshift" } ] }, "apiVersion": "v1", "metadata": { "name": "iperf-slow", "annotations": { "kubernetes.io/ingress-bandwidth": "10M", "kubernetes.io/egress-bandwidth": "10M" } } }
오브젝트 정의를 사용하여 Pod를 생성합니다.
$ oc create -f <file_or_dir_path>
7.5. 포드 중단 예산 설정
Pod 중단 예산 은 Kubernetes API의 일부이며 다른 오브젝트 유형과 같은 oc
명령으로 관리할 수 있습니다. 유지 관리를 위해 노드를 드레이닝하는 것과 같이 작업 중에 pod 에 대한 보안 제약 조건을 지정할 수 있습니다.
PodDisruptionBudget
은 동시에 작동해야 하는 최소 복제본 수 또는 백분율을 지정하는 API 오브젝트입니다. 프로젝트에서 이러한 설정은 노드 유지 관리 (예: 클러스터 축소 또는 클러스터 업그레이드) 중에 유용할 수 있으며 (노드 장애 시가 아니라) 자발적으로 제거된 경우에만 적용됩니다.
PodDisruptionBudget
오브젝트의 구성은 다음과 같은 주요 부분으로 구성되어 있습니다.
- 일련의 pod에 대한 라벨 쿼리 기능인 라벨 선택기입니다.
- 동시에 사용할 수 있어야 하는 최소 Pod 수를 지정하는 가용성 수준입니다.
다음은 PodDisruptionBudget
리소스의 예입니다.
apiVersion: policy/v1beta1 1 kind: PodDisruptionBudget metadata: name: my-pdb spec: selector: 2 matchLabels: foo: bar minAvailable: 2 3
위의 오브젝트 정의를 사용하여 YAML 파일을 생성한 경우 다음을 사용하여 프로젝트에 추가할 수 있습니다.
$ oc create -f </path/to/file> -n <project_name>
다음을 사용하여 모든 프로젝트에서 pod 중단 예산을 확인할 수 있습니다.
$ oc get poddisruptionbudget --all-namespaces NAMESPACE NAME MIN-AVAILABLE SELECTOR another-project another-pdb 4 bar=foo test-project my-pdb 2 foo=bar
PodDisruptionBudget
은 시스템에서 최소 minAvailable
pod가 실행중인 경우 정상으로 간주됩니다. 이 제한을 초과하는 모든 Pod는 제거할 수 있습니다.
Pod 우선순위 및 선점 설정에 따라 우선순위가 낮은 Pod는 Pod 중단 예산 요구 사항에도 불구하고 제거될 수 있습니다.
7.6. 중요한 Pod 구성
완전한 클러스터에 중요하지만 마스터가 아닌 일반 클러스터 노드에서 실행되는 DNS와 같은 많은 핵심 구성 요소가 있습니다. 중요한 추가 기능이 제거되면 클러스터가 제대로 작동하지 않을 수 있습니다. Descheduler 가 이러한 Pod를 제거하지 않도록 Pod 사양에 scheduler.alpha.kubernetes.io/critical-pod
주석을 추가하여 Pod를 중요화할 수 있습니다.
spec: template: metadata: name: critical-pod annotations: scheduler.alpha.kubernetes.io/critical-pod: "true"
8장. 네트워킹 관리
8.1. 개요
이 주제에서는 프로젝트 격리 및 아웃바운드 트래픽 제어를 포함하여 전체 클러스터 네트워크의 관리에 대해 설명합니다.
Pod별 대역폭 제한과 같은 Pod 수준 네트워킹 기능에 대해서는 Pod 관리에서 설명합니다.
8.2. Pod 네트워크 관리
클러스터가 ovs-multitenant SDN 플러그인을 사용하도록 구성된 경우 관리자 CLI를 사용하여 프로젝트에 대한 개별 포드 오버레이 네트워크를 관리할 수 있습니다. 필요한 경우 플러그인 구성 단계는 Configuring the SDN 섹션을 참조하십시오.
8.2.1. 프로젝트 네트워크 참여
기존 프로젝트 네트워크에 프로젝트를 참여하려면 다음을 수행합니다.
$ oc adm pod-network join-projects --to=<project1> <project2> <project3>
위의 예에서 <project2> 및 <project
의 모든 Pod 및 서비스에 액세스할 수 있으며 그 반대의 경우도 마찬가지입니다. 서비스는 IP 또는 정규화된 DNS 이름(3>
의 모든 Pod 및 서비스는 <project1>
;<service>.<pod_namespace>.svc.cluster.local)을 통해 액세스할 수 있습니다.
예를 들어 myproject 프로젝트에서
을 사용합니다.
db
라는 서비스에 액세스하려면 db.myproject
.svc.cluster.local
또는 특정 프로젝트 이름을 지정하는 대신 --selector=<project_selector>
옵션을 사용할 수 있습니다.
함께 참여한 네트워크를 확인하려면 다음을 수행합니다.
$ oc get netnamespaces
그런 다음 NETID 열을 확인합니다. 동일한 포드 네트워크에 있는 프로젝트는 동일한 NetID를 갖습니다.
8.3. 프로젝트 네트워크 격리
클러스터에서 프로젝트 네트워크를 격리하고 그 반대로 격리하려면 다음을 실행합니다.
$ oc adm pod-network isolate-projects <project1> <project2>
위 예제에서 <project1> 및 <
의 모든 Pod 및 서비스는 클러스터의 다른 글로벌이 아닌 프로젝트에서 포드 및 서비스에 액세스할 수 없으며 그 반대의 경우도 마찬가지입니다.
project2>
또는 특정 프로젝트 이름을 지정하는 대신 --selector=<project_selector>
옵션을 사용할 수 있습니다.
8.3.1. 프로젝트 네트워크 글로벌화
프로젝트에서 클러스터의 모든 Pod 및 서비스에 액세스할 수 있도록 허용하려면 다음을 수행합니다.
$ oc adm pod-network make-projects-global <project1> <project2>
위의 예에서 <project1> 및 <
의 모든 Pod 및 서비스는 이제 클러스터의 모든 Pod 및 서비스에 액세스할 수 있으며 그 반대의 경우도 마찬가지입니다.
project2>
또는 특정 프로젝트 이름을 지정하는 대신 --selector=<project_selector>
옵션을 사용할 수 있습니다.
8.4. 경로 및 Ingress 개체에 대한 호스트 이름 충돌 방지 비활성화
OpenShift Container Platform에서는 경로 및 수신 오브젝트에 대한 호스트 이름 충돌 방지가 기본적으로 활성화되어 있습니다. 즉, cluster-admin 역할이 없는 사용자는 생성 시에만 경로 또는 인그레스 개체에 호스트 이름을 설정할 수 있으며 나중에 변경할 수 없습니다. 그러나 일부 또는 모든 사용자의 경로 및 수신 오브젝트에 대한 이 제한을 완화할 수 있습니다.
OpenShift Container Platform은 오브젝트 생성 타임스탬프를 사용하여 지정된 호스트 이름의 가장 오래된 경로 또는 인그레스 오브젝트를 결정하기 때문에 이전 경로에서 호스트 이름을 변경하거나 인그레스 오브젝트가 도입되면 경로 또는 수신 개체의 호스트 이름을 가로챌 수 있습니다.
OpenShift Container Platform 클러스터 관리자는 생성 후도 경로에서 호스트 이름을 편집할 수 있습니다. 특정 사용자가 수행할 수 있도록 역할을 생성할 수도 있습니다.
$ oc create clusterrole route-editor --verb=update --resource=routes.route.openshift.io/custom-host
그런 다음 새 역할을 사용자에게 바인딩할 수 있습니다.
$ oc adm policy add-cluster-role-to-user route-editor user
수신 오브젝트에 대한 호스트 이름 충돌 방지를 비활성화할 수도 있습니다. 이렇게 하면 cluster-admin 역할 없이 사용자가 생성한 후 인그레스 오브젝트에 대한 호스트 이름을 편집할 수 있습니다. 이는 수신 오브젝트의 호스트 이름을 편집하는 것을 포함하여 Kubernetes 동작에 따라 OpenShift Container Platform 설치에 유용합니다.
master.yaml 파일에 다음을 추가합니다.
admissionConfig: pluginConfig: openshift.io/IngressAdmission: configuration: apiVersion: v1 allowHostnameChanges: true kind: IngressAdmissionConfig location: ""
변경 사항을 적용하려면 마스터 서비스를 다시 시작하십시오.
$ master-restart api $ master-restart controllers
8.5. 송신 트래픽 제어
클러스터 관리자는 호스트 수준에서 특정 노드에 여러 정적 IP 주소를 할당할 수 있습니다. 애플리케이션 개발자에게 애플리케이션 서비스에 전용 IP 주소가 필요한 경우 방화벽 액세스를 요청하는 데 사용하는 프로세스 중에 하나를 요청할 수 있습니다. 그런 다음 배포 구성에서 nodeSelector
를 사용하여 개발자의 프로젝트에서 송신 라우터를 배포하여 포드가 사전 할당된 고정 IP 주소가 있는 호스트에 배치되도록 할 수 있습니다.
송신 Pod의 배포는 소스 IP 중 하나, 보호된 서비스의 대상 IP 및 대상에 도달할 게이트웨이 IP를 선언합니다. 포드가 배포되면 송신 라우터 포드에 액세스 하는 서비스를 만든 다음 해당 소스 IP를 회사 방화벽에 추가할 수 있습니다. 그런 다음 개발자는 프로젝트에서 생성된 출력 라우터 서비스에 대한 액세스 정보(예: service.project.cluster.domainname.com
)를 보유합니다.
개발자가 방화벽 외부 서비스에 액세스해야 하는 경우 실제 보호 서비스 URL 대신 애플리케이션(예: JDBC 연결 정보)의 출력 라우터 포드 서비스(예:service.project.cluster.domainname.com
)를 호출할 수 있습니다.
또한 프로젝트에 고정 IP 주소를 할당하여 지정된 프로젝트에서 나가는 모든 외부 연결이 인식할 수 있는지 확인할 수 있습니다. 특정 대상에 트래픽을 보내는 데 사용되는 기본 출력 라우터와는 다릅니다.
자세한 내용은 외부 프로젝트 트래픽에 대한 고정 IP 활성화 섹션을 참조하십시오.
OpenShift Container Platform 클러스터 관리자는 다음과 같은 방식으로 송신 트래픽을 제어할 수 있습니다.
- 방화벽
- 송신 방화벽을 사용하면 허용 가능한 아웃바운드 트래픽 정책을 적용하여 특정 엔드포인트 또는 IP 범위(서브넷)가 통신할 동적 끝점(OpenShift Container Platform 내 포드)에 대해 허용 가능한 유일한 대상입니다.
- 라우터
- 출력 라우터를 사용하면 특정 대상에 트래픽을 보내도록 식별 가능한 서비스를 만들 수 있으므로 외부 대상에서 트래픽을 알려진 소스에서 들어오는 것처럼 취급할 수 있습니다. 이는 네임스페이스의 특정 포드만 데이터베이스에 대한 트래픽을 프록시하는 서비스( 송신 라우터)와 통신할 수 있도록 외부 데이터베이스를 보안할 수 있기 때문에 보안에 유용합니다.
- iptables
- 위의 OpenShift Container Platform 내부 솔루션 외에도 발신 트래픽에 적용할 iptables 규칙을 만들 수도 있습니다. 이러한 규칙은 송신 방화벽보다 더 많은 가능성을 허용하지만 특정 프로젝트로 제한할 수는 없습니다.
8.6. 송신 방화벽을 사용하여 외부 리소스에 대한 액세스 제한
OpenShift Container Platform 클러스터 관리자는 송신 방화벽 정책을 사용하여 일부 또는 모든 Pod가 클러스터 내에서 액세스할 수 있는 외부 IP 주소를 제한할 수 있습니다. 송신 방화벽 정책에서는 다음 시나리오를 지원합니다.
- 포드는 내부 호스트에만 연결할 수 있으며 공용 인터넷에 대한 연결을 시작할 수 없습니다.
- Pod는 공용 인터넷에만 연결할 수 있으며 OpenShift Container Platform 클러스터 외부에 있는 내부 호스트에 대한 연결을 시작할 수 없습니다.
- Pod는 지정된 내부 서브넷 또는 연결할 수 없는 호스트에 연결할 수 없습니다.
송신 정책은 CIDR 형식으로 IP 주소 범위를 지정하거나 DNS 이름을 지정하여 설정할 수 있습니다. 예를 들어 <project_A>
가 지정된 IP 범위에 액세스할 수 있지만 <project_B>
에 대한 동일한 액세스를 거부할 수 있습니다. 또는 애플리케이션 개발자가 (Python) pip 미러에서 업데이트하지 못하도록 제한하고 승인된 소스에서만 업데이트를 강제로 제공할 수 있습니다.
송신 정책을 통해 Pod 액세스를 제한하려면 ovs-multitenant 또는 ovs-networkpolicy 플러그인을 활성화해야 합니다.
ovs-multitenant 플러그인을 사용하는 경우 송신 정책은 프로젝트당 하나의 정책과만 호환되며 글로벌 프로젝트와 같은 네트워크를 공유하는 프로젝트에서는 작동하지 않습니다.
프로젝트 관리자는 EgressNetworkPolicy 오브젝트
를 생성하거나 프로젝트에서 생성한 개체를 편집할 수 없습니다. 또한 EgressNetworkPolicy
를 생성할 수 있는 몇 가지 제한 사항이 있습니다.
-
기본
프로젝트(및oc adm pod-network make-projects-global
를 통해 전역적으로 수행된 다른 프로젝트)에는 송신 정책이 없습니다. -
oc adm pod-network join-projects
를 통해 두 개의 프로젝트를 함께 병합하면 결합된 프로젝트에서 송신 정책을 사용할 수 없습니다. - 송신 정책 오브젝트가 두 개 이상일 수 있는 프로젝트는 없습니다.
이러한 제한 사항을 위반하면 프로젝트의 송신 정책이 손상되고 모든 외부 네트워크 트래픽이 삭제될 수 있습니다.
oc
명령 또는 REST API를 사용하여 송신 정책을 구성합니다. oc [create|replace|delete]
를 사용하여 EgressNetworkPolicy 오브젝트
를 조작할 수 있습니다. api/swagger-spec/oapi-v1.json 파일에는 오브젝트의 실제 작동 방식에 대한 API 수준의 세부 정보가 있습니다.
송신 정책을 구성하려면 다음을 수행합니다.
- 영향을 미칠 프로젝트로 이동합니다.
다음 예와 같이 사용할 정책 구성을 사용하여 JSON 파일을 생성합니다.
{ "kind": "EgressNetworkPolicy", "apiVersion": "v1", "metadata": { "name": "default" }, "spec": { "egress": [ { "type": "Allow", "to": { "cidrSelector": "1.2.3.0/24" } }, { "type": "Allow", "to": { "dnsName": "www.foo.com" } }, { "type": "Deny", "to": { "cidrSelector": "0.0.0.0/0" } } ] } }
위의 예가 프로젝트에 추가되면 IP 범위
1.2.3.0/24
및 도메인 이름www.foo.com
에 대한 트래픽을 허용하지만 다른 모든 외부 IP 주소에 대한 액세스를 거부합니다. 정책이 외부 트래픽에만 적용되므로 다른 포드에 대한 트래픽은 영향을 받지 않습니다.EgressNetworkPolicy
의 규칙이 순서대로 확인되고 일치하는 첫 번째 규칙이 적용됩니다. 위 예제의 세 규칙이 되돌리면0.0.0.0/0
규칙이 먼저 확인되므로 트래픽이1.2.3.0/24
및www.foo.com
에 허용되지 않으며 모든 트래픽과 일치하고 거부됩니다.도메인 이름 업데이트는 로컬 권한이 없는 서버가 반환한 도메인의 TTL(Time to Live) 값을 기준으로 폴링됩니다. 또한 Pod는 필요한 경우 동일한 로컬 이름 서버에서 도메인을 확인해야 합니다. 그렇지 않으면 송신 네트워크 정책 컨트롤러에서 인식하는 도메인의 IP 주소가 다르며 Pod는 다르며 송신 네트워크 정책은 예상대로 적용되지 않을 수 있습니다. 송신 네트워크 정책 컨트롤러와 Pod는 동일한 로컬 이름 서버를 비동기적으로 폴링하므로 Pod에서 송신 컨트롤러 전에 업데이트된 IP를 가져올 수 있는 경쟁 조건이 있을 수 있습니다. 이러한 현재 제한으로 인해
EgressNetworkPolicy
의 도메인 이름 사용은 IP 주소가 자주 변경되지 않는 도메인에만 권장됩니다.참고송신 방화벽을 사용하면 Pod가 DNS 확인을 위해 Pod가 있는 노드의 외부 인터페이스에 항상 액세스할 수 있습니다. 로컬 노드에서 DNS 확인을 처리하지 않으면 Pod에서 도메인 이름을 사용하는 경우 DNS 서버의 IP 주소에 대한 액세스를 허용하는 송신 방화벽 규칙을 추가해야 합니다.
JSON 파일을 사용하여 EgressNetworkPolicy 오브젝트를 생성합니다.
$ oc create -f <policy>.json
경로를 생성하여 서비스를 노출하면 EgressNetworkPolicy
가 무시됩니다. 송신 네트워크 정책 서비스 끝점 필터링은 노드 kubeproxy
에서 수행됩니다. 라우터가 연결되어 있으면 kubeproxy
를 우회하고 송신 네트워크 정책 시행이 적용되지 않습니다. 관리자는 경로를 생성하도록 액세스를 제한하여 이 바이패스를 방지할 수 있습니다.
8.6.1. 송신 라우터를 사용하여 외부 리소스를 허용하여 포드 트래픽 파악
OpenShift Container Platform 송신 라우터는 다른 업무에 사용되지 않는 프라이빗 소스 IP 주소를 사용하여 지정된 원격 서버로 트래픽을 리디렉션하는 서비스를 실행합니다. 서비스를 사용하면 포드가 허용된 IP 주소에서만 액세스할 수 있도록 설정된 서버와 통신할 수 있습니다.
출력 라우터는 나가는 모든 연결을 위한 것이 아닙니다. 다수의 송신 라우터를 생성하면 네트워크 하드웨어의 제한을 푸시할 수 있습니다. 예를 들어 모든 프로젝트 또는 애플리케이션에 대해 송신 라우터를 생성하면 소프트웨어에서 MAC 주소 필터링으로 대체하기 전에 네트워크 인터페이스에서 처리할 수 있는 로컬 MAC 주소 수를 초과할 수 있습니다.
현재 송신 라우터는 Amazon AWS, Azure Cloud 또는 macvlan 트래픽과의 비호환성으로 인해 계층 2 조작을 지원하지 않는 기타 클라우드 플랫폼과 호환되지 않습니다.
배포 고려 사항
Egress 라우터는 노드의 기본 네트워크 인터페이스에 두 번째 IP 주소와 MAC 주소를 추가합니다. 베어 메탈에서 OpenShift Container Platform을 실행하지 않는 경우 추가 주소를 허용하도록 하이퍼바이저 또는 클라우드 공급자를 구성해야 할 수 있습니다.
- Red Hat OpenStack Platform
Red Hat OpenStack Platform에 OpenShift Container Platform을 배포하는 경우 OpenStack 환경에서 IP 및 MAC 주소를 허용 목록에 추가해야 합니다. 그렇지 않으면 통신에 실패합니다.
neutron port-update $neutron_port_uuid \ --allowed_address_pairs list=true \ type=dict mac_address=<mac_address>,ip_address=<ip_address>
- Red Hat Enterprise Virtualization
-
Red Hat Enterprise Virtualization을 사용하는 경우
EnableMACAntiSpoofingFilterRules
를false
로 설정해야 합니다. - VMware vSphere
- VMware vSphere를 사용하는 경우 vSphere 표준 스위치 보안을 위한 VMWare 설명서를 참조하십시오. vSphere Web Client에서 호스트의 가상 스위치를 선택하여 VMWare vSphere 기본 설정을 보고 변경합니다.
특히 다음이 활성화되어 있는지 확인하십시오.
송신 라우터 모드
송신 라우터는 리디렉션 모드,HTTP 프록시 모드 및 DNS 프록시 모드의 세 가지 모드로 실행될 수 있습니다. 리디렉션 모드는 HTTP 및 HTTPS를 제외한 모든 서비스에서 작동합니다. HTTP 및 HTTPS 서비스의 경우 HTTP 프록시 모드를 사용하십시오. IP 주소 또는 도메인 이름이 있는 TCP 기반 서비스는 DNS 프록시 모드를 사용하십시오.
8.6.1.1. 리디렉션 모드에서 송신 라우터 Pod 배포
리디렉션 모드에서 송신 라우터는 자체 IP 주소에서 하나 이상의 대상 IP 주소로 트래픽을 리디렉션하도록 iptables 규칙을 설정합니다. 예약된 소스 IP 주소를 사용하려는 클라이언트 Pod는 대상 IP에 직접 연결하는 대신 송신 라우터에 연결하도록 수정해야 합니다.
다음을 사용하여 Pod 구성을 생성합니다.
apiVersion: v1 kind: Pod metadata: name: egress-1 labels: name: egress-1 annotations: pod.network.openshift.io/assign-macvlan: "true" 1 spec: initContainers: - name: egress-router image: registry.redhat.io/openshift3/ose-egress-router securityContext: privileged: true env: - name: EGRESS_SOURCE 2 value: 192.168.12.99/24 - name: EGRESS_GATEWAY 3 value: 192.168.12.1 - name: EGRESS_DESTINATION 4 value: 203.0.113.25 - name: EGRESS_ROUTER_MODE 5 value: init containers: - name: egress-router-wait image: registry.redhat.io/openshift3/ose-pod nodeSelector: site: springfield-1 6
- 1
- 기본 네트워크 인터페이스에서 Macvlan 네트워크 인터페이스를 만들고 egress-router 컨테이너를 시작하기 전에 Pod의 네트워크 프로젝트로 이동합니다.
"true"
로 따옴표를 보존합니다. 생략하면 오류가 발생합니다. 기본 인터페이스가 아닌 네트워크 인터페이스에서 Macvlan 인터페이스를 생성하려면 주석 값을 해당 인터페이스 이름으로 설정합니다. 예를 들면eth1
입니다. - 2
- 노드가 있고 이 포드에서 사용하도록 클러스터 관리자가 예약한 실제 네트워크의 IP 주소입니다. 선택적으로 서브넷 길이
/24
접미사를 포함하여 로컬 서브넷 경로를 설정할 수 있습니다. 서브넷 길이를 지정하지 않으면 송신 라우터에서EGRESS_GATEWAY
변수로 지정된 호스트에만 액세스하고 서브넷의 다른 호스트에는 액세스할 수 없습니다. - 3
- 노드에서 사용하는 기본 게이트웨이와 동일한 값입니다.
- 4
- 트래픽을 전달할 외부 서버입니다. 이 예제를 사용하면 포드에 대한 연결이 소스 IP 주소가 192.168.12.99인 203.0.113.25로 리디렉션됩니다.
- 5
- 이는 송신 라우터 이미지가 "init 컨테이너"로 배포됨을 알려줍니다. 이전 버전의 OpenShift Container Platform(및 송신 라우터 이미지)은 이 모드를 지원하지 않으며 일반 컨테이너로 실행해야 했습니다.
- 6
- 포드는 레이블이
site=springfield-1
인 노드에만 배포됩니다.
위의 정의를 사용하여 Pod를 생성합니다.
$ oc create -f <pod_name>.json
Pod가 생성되었는지 확인하려면 다음을 수행합니다.
$ oc get pod <pod_name>
송신 라우터를 가리키도록 서비스를 생성하여 다른 Pod에서 Pod의 IP 주소를 찾을 수 있는지 확인합니다.
apiVersion: v1 kind: Service metadata: name: egress-1 spec: ports: - name: http port: 80 - name: https port: 443 type: ClusterIP selector: name: egress-1
이제 Pod에서 이 서비스에 연결할 수 있습니다. 이러한 연결은 예약된 송신 IP 주소를 사용하여 외부 서버의 해당 포트로 리디렉션됩니다.
송신 라우터 설정은 openshift3/ose-egress-router 이미지에서 생성된 "init 컨테이너"에서 수행되며, 해당 컨테이너는 Macvlan 인터페이스를 구성하고 iptables
규칙을 설정할 수 있도록 권한이 부여됩니다. iptables
규칙 설정이 완료되면 종료되고 pod가 종료될 때까지 openshift3/ose-pod 컨테이너가 실행(아무 것도 수행하지 않음)됩니다.
환경 변수는 사용할 주소를 송신 라우터 이미지에 알립니다. EGRESS_ GATEWAY
를 게이트웨이로 사용하여 EGRESS_SOURCE
를 IP 주소로 사용하도록 Macvlan 인터페이스를 구성합니다.
NAT 규칙은 Pod의 클러스터 IP 주소의 TCP 또는 UDP 포트에 대한 연결이 EGRESS_DESTINATION
의 동일한 포트로 리디렉션되도록 설정됩니다.
클러스터의 일부 노드만 지정된 소스 IP 주소를 요청하고 지정된 게이트웨이를 사용할 수 있는 경우 허용 가능한 노드를 나타내는 nodeName
또는 nodeSelector
를 지정할 수 있습니다.
8.6.1.2. 여러 대상으로 리디렉션
이전 예에서 모든 포트의 송신 포드(또는 해당 서비스)에 대한 연결은 단일 대상 IP로 리디렉션됩니다. 포트에 따라 다양한 대상 IP를 구성할 수도 있습니다.
apiVersion: v1 kind: Pod metadata: name: egress-multi labels: name: egress-multi annotations: pod.network.openshift.io/assign-macvlan: "true" spec: initContainers: - name: egress-router image: registry.redhat.io/openshift3/ose-egress-router securityContext: privileged: true env: - name: EGRESS_SOURCE 1 value: 192.168.12.99/24 - name: EGRESS_GATEWAY value: 192.168.12.1 - name: EGRESS_DESTINATION 2 value: | 80 tcp 203.0.113.25 8080 tcp 203.0.113.26 80 8443 tcp 203.0.113.26 443 203.0.113.27 - name: EGRESS_ROUTER_MODE value: init containers: - name: egress-router-wait image: registry.redhat.io/openshift3/ose-pod
EGRESS_DESTINATION
의 각 줄은 다음 세 가지 유형 중 하나일 수 있습니다.
-
<port> <protocol> <IP_address>
- 지정된<port>
에 대한 수신되는 연결을 지정된<IP_address>의 동일한 포트로 리디렉션해야 합니다.
<protocol>
은tcp
또는udp
입니다. 위의 예에서 첫 번째 줄은 트래픽을 로컬 포트 80에서 203.0.113.25의 포트 80으로 리디렉션합니다. -
<port> <protocol> <IP_address> <remote_port>
- 연결이 <IP_address>의 다른
위의 예에서 두 번째 및 세 번째 줄은 로컬 포트 8080 및 8443을 203.0.113.26의 원격 포트 80 및 443으로 리디렉션합니다.<remote_port>
로 리디렉션된다는 점을 제외하고는 위와 같습니다. -
<fallback_IP_address>
-EGRESS_DESTINATION
의 마지막 줄이 단일 IP 주소인 경우 다른 포트의 모든 연결이 해당 IP 주소의 해당 포트(예: 위의 예에서 203.0.113.27)로 리디렉션됩니다. 대체 IP 주소가 없으면 다른 포트의 연결이 단순히 거부됩니다.)
8.6.1.3. ConfigMap을 사용하여 EGRESS_DESTINATION 지정
대규모 또는 자주 변경되는 대상 매핑 세트의 경우 ConfigMap을 사용하여 목록을 외부적으로 유지 관리하고 송신 라우터 Pod에서 해당 매핑을 읽도록 할 수 있습니다. 이는 프로젝트 관리자가 ConfigMap을 편집할 수 있는 장점이 있지만 권한 있는 컨테이너가 포함되어 있기 때문에 Pod 정의를 직접 편집하지 못할 수 있습니다.
EGRESS_DESTINATION
데이터가 포함된 파일을 생성합니다.$ cat my-egress-destination.txt # Egress routes for Project "Test", version 3 80 tcp 203.0.113.25 8080 tcp 203.0.113.26 80 8443 tcp 203.0.113.26 443 # Fallback 203.0.113.27
빈 줄과 주석을 이 파일에 넣을 수 있습니다.
파일에서 ConfigMap 오브젝트를 생성합니다.
$ oc delete configmap egress-routes --ignore-not-found $ oc create configmap egress-routes \ --from-file=destination=my-egress-destination.txt
여기서
egress-routes
는 생성되는 ConfigMap 오브젝트의 이름이고my-egress-destination.txt
는 데이터를 읽을 파일의 이름입니다.위와 같이 송신 라우터 Pod 정의를 생성하되 환경 섹션에서
EGRESS_DESTINATION
에 대한 ConfigMap을 지정합니다.... env: - name: EGRESS_SOURCE 1 value: 192.168.12.99/24 - name: EGRESS_GATEWAY value: 192.168.12.1 - name: EGRESS_DESTINATION valueFrom: configMapKeyRef: name: egress-routes key: destination - name: EGRESS_ROUTER_MODE value: init ...
- 1
- 노드가 있고 이 포드에서 사용하도록 클러스터 관리자가 예약한 실제 네트워크의 IP 주소입니다. 선택적으로 서브넷 길이
/24
접미사를 포함하여 로컬 서브넷 경로를 설정할 수 있습니다. 서브넷 길이를 지정하지 않으면 송신 라우터에서EGRESS_GATEWAY
변수로 지정된 호스트에만 액세스하고 서브넷의 다른 호스트에는 액세스할 수 없습니다.
출력 라우터는 ConfigMap이 변경되면 자동으로 업데이트되지 않습니다. 포드를 다시 시작하여 업데이트를 가져옵니다.
8.6.1.4. 송신 라우터 HTTP 프록시 Pod 배포
HTTP 프록시 모드에서는 송신 라우터가 포트 8080
에서 HTTP 프록시로 실행됩니다. 이 방법은 HTTP 또는 HTTPS 기반 서비스에 대한 통신 클라이언트에서만 작동하지만 일반적으로 클라이언트 포드를 덜 변경하여 작동하도록 해야 합니다. 환경 변수를 설정하여 HTTP 프록시를 사용하도록 프로그램을 지정할 수 있습니다.
예를 들어 다음을 사용하여 Pod를 생성합니다.
apiVersion: v1 kind: Pod metadata: name: egress-http-proxy labels: name: egress-http-proxy annotations: pod.network.openshift.io/assign-macvlan: "true" 1 spec: initContainers: - name: egress-router-setup image: registry.redhat.io/openshift3/ose-egress-router securityContext: privileged: true env: - name: EGRESS_SOURCE 2 value: 192.168.12.99/24 - name: EGRESS_GATEWAY 3 value: 192.168.12.1 - name: EGRESS_ROUTER_MODE 4 value: http-proxy containers: - name: egress-router-proxy image: registry.redhat.io/openshift3/ose-egress-http-proxy env: - name: EGRESS_HTTP_PROXY_DESTINATION 5 value: | !*.example.com !192.168.1.0/24 *
- 1
- 기본 네트워크 인터페이스에서 Macvlan 네트워크 인터페이스를 만든 다음 egress-router 컨테이너를 시작하기 전에 Pod의 네트워크 프로젝트로 이동합니다.
"true"
로 따옴표를 보존합니다. 생략하면 오류가 발생합니다. - 2
- 노드가 있고 이 포드에서 사용하도록 클러스터 관리자가 예약한 실제 네트워크의 IP 주소입니다. 선택적으로 서브넷 길이
/24
접미사를 포함하여 로컬 서브넷 경로를 설정할 수 있습니다. 서브넷 길이를 지정하지 않으면 송신 라우터에서EGRESS_GATEWAY
변수로 지정된 호스트에만 액세스하고 서브넷의 다른 호스트에는 액세스할 수 없습니다. - 3
- 노드 자체에서 사용하는 기본 게이트웨이와 동일한 값입니다.
- 4
- 이는 송신 라우터 이미지가 HTTP 프록시의 일부로 배포 중임을 나타내므로 iptables 리디렉션 규칙을 설정하지 않아야 합니다.
- 5
- 프록시 구성 방법을 지정하는 문자열 또는 여러 줄로 된 YAML 문자열입니다. 이 문자열은 init 컨테이너의 다른 환경 변수가 아닌 HTTP 프록시 컨테이너의 환경 변수로 지정됩니다.
EGRESS_HTTP_PROXY_DESTINATION
값에 대해 다음 중 하나를 지정할 수 있습니다.*
를 사용할 수도 있습니다. 즉, "모든 원격 대상에 대한 연결을 허용"할 수 있습니다. 구성의 각 줄은 허용 또는 거부할 하나의 연결 그룹을 지정합니다.-
IP 주소(예:
192.168.1.1
)는 해당 IP 주소에 대한 연결을 허용합니다. -
CIDR 범위(예:
192.168.1.0/24
)는 해당 CIDR 범위에 대한 연결을 허용합니다. -
호스트 이름(예:
www.example.com)
은 해당 호스트에 대한 프록시를 허용합니다. -
*(예:
*.
example.com
) 앞에 있는 도메인 이름은 해당 도메인 및 모든 하위 도메인에 대한 프록시를 허용합니다. -
그만큼
!
위의 모든 연결을 거부합니다. 허용하지 않고 -
마지막 줄이
*
이면 거부되지 않은 모든 사항이 허용됩니다. 그렇지 않으면 허용되지 않은 모든 것이 거부됩니다.
송신 라우터를 가리키도록 서비스를 생성하여 다른 Pod에서 Pod의 IP 주소를 찾을 수 있는지 확인합니다.
apiVersion: v1 kind: Service metadata: name: egress-1 spec: ports: - name: http-proxy port: 8080 1 type: ClusterIP selector: name: egress-1
- 1
http
포트가 항상8080
으로 설정되어 있는지 확인합니다.
http_proxy 또는
변수를 설정하여 HTTP 프록시를 사용하도록 클라이언트 Pod( 송신 프록시 Pod가 아님)를 구성합니다.https_proxy
... env: - name: http_proxy value: http://egress-1:8080/ 1 - name: https_proxy value: http://egress-1:8080/ ...
- 1
- 2단계에서 생성된 서비스입니다.
참고모든 설정에
http_proxy
및https_proxy
환경 변수를 사용할 필요는 없습니다. 위 방법으로 유효한 설정이 생성되지 않으면 Pod에서 실행 중인 툴이나 소프트웨어에 대한 설명서를 참조하십시오.
위의 리디렉션 송신 라우터 예와 마찬가지로 ConfigMap을 사용하여 EGRESS_HTTP_PROXY_DESTINATION
을 지정할 수도 있습니다.
8.6.1.5. 송신 라우터 DNS 프록시 Pod 배포
DNS 프록시 모드에서 송신 라우터는 자체 IP 주소에서 하나 이상의 대상 IP 주소로 TCP 기반 서비스의 DNS 프록시로 실행됩니다. 예약된 사용을 원하는 클라이언트 Pod에서는 대상 IP에 직접 연결하는 대신 송신 라우터에 연결하도록 소스 IP 주소를 수정해야 합니다. 이렇게 하면 외부 대상에서 트래픽을 알려진 소스에서 들어오는 것처럼 처리합니다.
예를 들어 다음을 사용하여 Pod를 생성합니다.
apiVersion: v1 kind: Pod metadata: name: egress-dns-proxy labels: name: egress-dns-proxy annotations: pod.network.openshift.io/assign-macvlan: "true" 1 spec: initContainers: - name: egress-router-setup image: registry.redhat.io/openshift3/ose-egress-router securityContext: privileged: true env: - name: EGRESS_SOURCE 2 value: 192.168.12.99/24 - name: EGRESS_GATEWAY 3 value: 192.168.12.1 - name: EGRESS_ROUTER_MODE 4 value: dns-proxy containers: - name: egress-dns-proxy image: registry.redhat.io/openshift3/ose-egress-dns-proxy env: - name: EGRESS_DNS_PROXY_DEBUG 5 value: "1" - name: EGRESS_DNS_PROXY_DESTINATION 6 value: | # Egress routes for Project "Foo", version 5 80 203.0.113.25 100 example.com 8080 203.0.113.26 80 8443 foobar.com 443
- 1
pod.network.openshift.io/assign-macvlan 주석을
사용하면 기본 네트워크 인터페이스에서 Macvlan 네트워크 인터페이스가 생성되고 egress-router-setup 컨테이너를 시작하기 전에 Pod의 네트워크 네임스페이스로 이동합니다."true"
로 따옴표를 보존합니다. 생략하면 오류가 발생합니다.- 2
- 노드가 있고 이 포드에서 사용하도록 클러스터 관리자가 예약한 실제 네트워크의 IP 주소입니다. 선택적으로 서브넷 길이
/24
접미사를 포함하여 로컬 서브넷 경로를 설정할 수 있습니다. 서브넷 길이를 지정하지 않으면 송신 라우터에서EGRESS_GATEWAY
변수로 지정된 호스트에만 액세스하고 서브넷의 다른 호스트에는 액세스할 수 없습니다. - 3
- 노드 자체에서 사용하는 기본 게이트웨이와 동일한 값입니다.
- 4
- 이는 송신 라우터 이미지가 DNS 프록시의 일부로 배포 중임을 나타내므로 iptables 리디렉션 규칙을 설정하지 않아야 합니다.
- 5
- 선택 사항: 이 변수를 설정하면 stdout에 DNS 프록시 로그 출력이 표시됩니다.
- 6
- 여러 줄 문자열에 YAML 구문을 사용합니다. 자세한 내용은 아래를 참조하십시오.
참고EGRESS_DNS_PROXY_DESTINATION
의 각 행은 다음 두 가지 방법 중 하나로 설정할 수 있습니다.-
<port> <remote_address>
- 지정된<port>에 대한 들어오는 연결이 지정된 <
remote_address>의 동일한 TCP 포트로 프록시되어야 함을 나타냅니다.
<remote_address>
는 IP 주소 또는 DNS 이름이 될 수 있습니다. DNS 이름의 경우 런타임에 DNS 확인이 수행됩니다. 위의 예에서 첫 번째 줄은 로컬 포트 80에서 203.0.113.25의 포트 80으로 TCP 트래픽을 프록시합니다. 두 번째 행은 example.com의 로컬 포트 100에서 포트 100으로 TCP 트래픽을 프록시합니다. -
<port> <remote_address> <remote_port>
- 연결이 <remote_address>의 다른
위의 예에서 세 번째 행은 203.0.113.26의 원격 포트 80으로 로컬 포트 8080을 프록시하고, 네 번째 행은 로컬 포트 8443을 foobar.com의 원격 포트 443으로 프록시합니다.<remote_port>
에 프록시된다는 점을 제외하고는 위와 같습니다.
송신 라우터를 가리키도록 서비스를 생성하여 다른 Pod에서 Pod의 IP 주소를 찾을 수 있는지 확인합니다.
apiVersion: v1 kind: Service metadata: name: egress-dns-svc spec: ports: - name: con1 protocol: TCP port: 80 targetPort: 80 - name: con2 protocol: TCP port: 100 targetPort: 100 - name: con3 protocol: TCP port: 8080 targetPort: 8080 - name: con4 protocol: TCP port: 8443 targetPort: 8443 type: ClusterIP selector: name: egress-dns-proxy
이제 Pod에서 이 서비스에 연결할 수 있습니다. 해당 연결은 예약된 송신 IP 주소를 사용하여 외부 서버의 해당 포트에 프록시됩니다.
위의 리디렉션 송신 라우터 예와 마찬가지로 ConfigMap 을 사용하여 EGRESS_DNS_PROXY_DESTINATION
을 지정할 수도 있습니다.
8.6.1.6. 송신 라우터 Pod의 장애 조치 활성화
복제 컨트롤러를 사용하면 다운타임을 방지하기 위해 송신 라우터 Pod의 복사본이 항상 1개 있는지 확인할 수 있습니다.
다음을 사용하여 복제 컨트롤러 구성 파일을 생성합니다.
apiVersion: v1 kind: ReplicationController metadata: name: egress-demo-controller spec: replicas: 1 1 selector: name: egress-demo template: metadata: name: egress-demo labels: name: egress-demo annotations: pod.network.openshift.io/assign-macvlan: "true" spec: initContainers: - name: egress-demo-init image: registry.redhat.io/openshift3/ose-egress-router env: - name: EGRESS_SOURCE 2 value: 192.168.12.99/24 - name: EGRESS_GATEWAY value: 192.168.12.1 - name: EGRESS_DESTINATION value: 203.0.113.25 - name: EGRESS_ROUTER_MODE value: init securityContext: privileged: true containers: - name: egress-demo-wait image: registry.redhat.io/openshift3/ose-pod nodeSelector: site: springfield-1
- 1
- 언제든지 지정된
EGRESS_SOURCE
값을 사용할 수 있으므로복제본이
1
로 설정되어 있는지 확인합니다. 즉, 레이블이site=springfield-1
인 노드에서 단일 라우터 사본만 실행됩니다. - 2
- 노드가 있고 이 포드에서 사용하도록 클러스터 관리자가 예약한 실제 네트워크의 IP 주소입니다. 선택적으로 서브넷 길이
/24
접미사를 포함하여 로컬 서브넷 경로를 설정할 수 있습니다. 서브넷 길이를 지정하지 않으면 송신 라우터에서EGRESS_GATEWAY
변수로 지정된 호스트에만 액세스하고 서브넷의 다른 호스트에는 액세스할 수 없습니다.
정의를 사용하여 Pod를 생성합니다.
$ oc create -f <replication_controller>.json
확인하려면 복제 컨트롤러 Pod가 생성되었는지 확인합니다.
$ oc describe rc <replication_controller>
8.6.2. iptables 규칙을 사용하여 외부 리소스에 대한 액세스 제한
일부 클러스터 관리자는 EgressNetworkPolicy
모델 또는 송신 라우터 모델에 맞지 않는 나가는 트래픽에 대한 작업을 수행할 수 있습니다. 경우에 따라 iptables 규칙을 직접 생성하여 이 작업을 수행할 수 있습니다.
예를 들어 특정 대상에 대한 트래픽을 기록하거나 초당 특정 수 이상의 나가는 연결을 방지하는 규칙을 만들 수 있습니다.
OpenShift Container Platform은 사용자 지정 iptables 규칙을 자동으로 추가하는 방법을 제공하지 않지만 관리자가 수동으로 이러한 규칙을 추가할 수 있는 장소를 제공합니다. 각 노드는 시작 시 필터
테이블에 OPENSHIFT-ADMIN-OUTPUT-RULES
라는 빈 체인을 생성합니다( 체인이 아직 존재하지 않는다고 가정). 관리자가 해당 체인에 추가된 규칙은 포드에서 클러스터 외부 대상으로 이동하는 모든 트래픽(다른 트래픽에 해당하지 않음)에 적용됩니다.
이 기능을 사용할 때 주의해야 할 몇 가지 사항이 있습니다.
- 각 노드에서 규칙이 생성되도록 해야 합니다. OpenShift Container Platform은 이러한 규칙을 자동으로 수행하지 않습니다.
-
규칙은 송신 라우터를 통해 클러스터를 종료하는 트래픽에 적용되지 않으며
EgressNetworkPolicy
규칙이 적용된 후 실행됩니다. 따라서EgressNetworkPolicy
에서 거부하는 트래픽을 확인하지 않습니다. - 노드에 "외부" IP 주소와 "내부" SDN IP 주소가 모두 있기 때문에 포드에서 노드 또는 포드로의 연결 처리가 복잡합니다. 따라서 일부 Pod-to-node/master 트래픽이 이 체인을 통과할 수 있지만 다른 Pod-to-node/master 트래픽은 이를 바이패스할 수 있습니다.
8.7. 외부 프로젝트 트래픽의 정적 IP 활성화
클러스터 관리자는 트래픽을 외부에서 쉽게 인식할 수 있도록 특정 정적 IP 주소를 프로젝트에 할당할 수 있습니다. 특정 대상에 트래픽을 보내는 데 사용되는 기본 출력 라우터와는 다릅니다.
인식할 수 있는 IP 트래픽은 출처가 표시되는지 확인하여 클러스터 보안을 강화합니다. 활성화되면 지정된 프로젝트에서 나가는 모든 외부 연결이 동일한 고정 소스 IP를 공유합니다. 즉, 모든 외부 리소스가 트래픽을 인식할 수 있습니다.
출력 라우터와 달리 이는 EgressNetworkPolicy
방화벽 규칙의 영향을 받습니다.
클러스터의 프로젝트에 고정 IP 주소를 할당하려면 SDN에서 ovs-networkpolicy 또는 ovs- multitenant 네트워크 플러그인을 사용해야 합니다.
다중 테넌트 모드에서 OpenShift SDN을 사용하는 경우 연결된 프로젝트에 의해 다른 네임스페이스에 조인된 네임스페이스와 함께 송신 IP 주소를 사용할 수 없습니다. 예를 들어 oc adm pod-network join-projects --to=project1 project2
명령을 실행하여 project1
및 project2
를 조인한 경우 두 프로젝트 모두 송신 IP 주소를 사용할 수 없습니다. 자세한 내용은 BZ#1645577를 참조하십시오.
정적 소스 IP를 활성화하려면 다음을 수행합니다.
원하는 IP로
NetNamespace
를 업데이트합니다.$ oc patch netnamespace <project_name> -p '{"egressIPs": ["<IP_address>"]}'
예를 들어
MyProject
프로젝트를 IP 주소 192.168.1.100에 할당하려면 다음을 수행합니다.$ oc patch netnamespace MyProject -p '{"egressIPs": ["192.168.1.100"]}'
egressIPs
필드는 배열입니다. 고가용성을 제공하기 위해egressIP
를 다른 노드에서 둘 이상의 IP 주소로 설정할 수 있습니다. 여러 송신 IP 주소가 설정되어 있으면 Pod는 목록의 첫 번째 IP를 송신에 사용하지만, 해당 IP 주소를 호스팅하는 노드가 실패하면 Pod는 잠시 후 목록의 다음 IP를 사용하도록 전환됩니다.원하는 노드 호스트에 송신 IP를 수동으로 할당합니다. 노드 호스트의
HostSubnet
오브젝트에서egressIPs
필드를 설정합니다. 해당 노드 호스트에 할당하려는 만큼의 IP를 포함합니다.$ oc patch hostsubnet <node_name> -p \ '{"egressIPs": ["<IP_address_1>", "<IP_address_2>"]}'
예를 들어
node1
에 송신 IP 192.168.1.100, 192.168.1.101 및 192.168.1.102가 있어야 한다고 설정하려면 다음을 실행합니다.$ oc patch hostsubnet node1 -p \ '{"egressIPs": ["192.168.1.100", "192.168.1.101", "192.168.1.102"]}'
중요송신 IP는 기본 네트워크 인터페이스에서 추가 IP 주소로 구현되며 노드의 기본 IP와 동일한 서브넷에 있어야 합니다. 또한 ifcfg-eth0 과 같은 Linux 네트워크 구성 파일에 외부 IP를 구성해서는 안 됩니다.
기본 네트워크 인터페이스에서 추가 IP 주소를 허용하려면 일부 클라우드 또는 VM 솔루션을 사용할 때 추가 구성이 필요할 수 있습니다.
위가 프로젝트에 대해 활성화되면 해당 프로젝트의 모든 송신 트래픽이 해당 송신 IP를 호스팅하는 노드로 라우팅된 다음 NAT를 사용하여 해당 IP 주소에 연결됩니다. egressIPs
가 NetNamespace
에 설정되어 있지만 해당 송신 IP를 호스팅하는 노드가 없는 경우 네임스페이스의 송신 트래픽이 삭제됩니다.
8.8. 자동 송신 IP 활성화
클러스터 관리자로서 외부 프로젝트 트래픽에 대해 정적 IP 활성화와 유사하게 egress IPs 매개변수를
설정하여 네임스페이스에 송신 IP 주소를 할당할 수 있습니다. 하나의 IP 주소만 프로젝트에 연결할 수 있습니다.
NetNamespace
리소스로
다중 테넌트 모드에서 OpenShift SDN을 사용하는 경우 연결된 프로젝트에 의해 다른 네임스페이스에 조인된 네임스페이스와 함께 송신 IP 주소를 사용할 수 없습니다. 예를 들어 oc adm pod-network join-projects --to=project1 project2
명령을 실행하여 project1
및 project2
를 조인한 경우 두 프로젝트 모두 송신 IP 주소를 사용할 수 없습니다. 자세한 내용은 BZ#1645577를 참조하십시오.
완전 자동 송신 IP를 사용하면 각 노드의 HostSubnet
리소스의 egressCIDRs
매개변수를 설정하여 호스팅할 수 있는 송신 IP 주소 범위를 나타낼 수 있습니다. 요청된 송신 IP 주소가 있는 네임스페이스는 해당 송신 IP 주소를 호스팅할 수 있는 노드와 일치한 다음 송신 IP 주소가 해당 노드에 할당됩니다.
고가용성은 자동입니다. 송신 IP 주소를 호스팅하는 노드가 중단되고 HostSubnet
리소스의 egressCIDR
값을 기반으로 해당 송신 IP 주소를 호스팅할 수 있는 노드가 있는 경우 송신 IP 주소가 새 노드로 이동합니다. 원래 송신 IP 주소 노드가 다시 온라인 상태가 되면 송신 IP 주소가 자동으로 이동하여 노드 간에 송신 IP 주소의 균형을 조정합니다.
동일한 노드 또는 동일한 IP 주소 범위에서 수동으로 할당 및 자동 할당된 송신 IP 주소를 사용할 수 없습니다.
송신 IP 주소로
NetNamespace
를 업데이트합니다.$ oc patch netnamespace <project_name> -p '{"egressIPs": ["<IP_address>"]}'
egressIPs
매개변수에 대해 단일 IP 주소만 지정할 수 있습니다. 다중 IP 주소 사용은 지원되지 않습니다.예를 들어
project1
을 IP 주소 192.168.1.100에 할당하고project2
를 IP 주소 192.168.1.101에 할당하려면 다음을 수행합니다.$ oc patch netnamespace project1 -p '{"egressIPs": ["192.168.1.100"]}' $ oc patch netnamespace project2 -p '{"egressIPs": ["192.168.1.101"]}''
egress
CIDRs
필드를 설정하여 송신 IP 주소를 호스팅할 수 있는 노드를 나타냅니다.$ oc patch hostsubnet <node_name> -p \ '{"egressCIDRs": ["<IP_address_range_1>", "<IP_address_range_2>"]}'
예를 들어,
node1
및node2
를 192.168.1.0에서 192.168.1.255 범위의 송신 IP 주소를 호스팅하도록 설정하려면 다음을 수행합니다.$ oc patch hostsubnet node1 -p '{"egressCIDRs": ["192.168.1.0/24"]}' $ oc patch hostsubnet node2 -p '{"egressCIDRs": ["192.168.1.0/24"]}'
-
OpenShift Container Platform은 특정 송신 IP 주소를 균형 있는 방식으로 사용 가능한 노드에 자동으로 할당합니다. 이 경우 송신 IP 주소 192.168.1.100을
node1
에 할당하고 송신 IP 주소 192.168.1.101을node2
에 할당하거나 그 반대의 경우도 마찬가지입니다.
8.9. 멀티 캐스트 활성화
현재 멀티캐스트는 고 대역폭 솔루션이 아닌 낮은 대역폭 조정 또는 서비스 검색에 가장 적합합니다.
OpenShift Container Platform Pod 간 멀티 캐스트 트래픽은 기본적으로 비활성화되어 있습니다. ovs-multitenant 또는 ovs -networkpolicy 플러그인을 사용하는 경우 프로젝트의 해당 netnamespace
오브젝트에 주석을 설정하여 프로젝트별로 멀티 캐스트를 활성화할 수 있습니다.
$ oc annotate netnamespace <namespace> \ netnamespace.network.openshift.io/multicast-enabled=true
주석을 제거하여 멀티 캐스트를 비활성화합니다.
$ oc annotate netnamespace <namespace> \ netnamespace.network.openshift.io/multicast-enabled-
ovs-multitenant 플러그인을 사용하는 경우:
- 격리된 프로젝트에서 포드에서 전송한 멀티 캐스트 패킷은 프로젝트의 다른 모든 포드로 전달됩니다.
-
네트워크를 함께 가입한 경우 각 프로젝트의
netnamespace
에서 멀티 캐스트를 활성화하여 모든 프로젝트에서 적용되도록 해야 합니다. 결합된 네트워크에서 Pod가 전송한 멀티 캐스트 패킷은 연결된 모든 네트워크의 모든 Pod로 전달됩니다. -
default
프로젝트에서 멀티 캐스트를 활성화하려면kube-service-catalog
프로젝트에서 도 활성화해야 합니다. 글로벌 프로젝트는 멀티 캐스트를 위해 "글로벌"이 아닙니다. 글로벌 프로젝트의 Pod에서 전송한 멀티 캐스트 패킷은 모든 프로젝트의 모든 포드가 아닌 다른 글로벌 프로젝트의 Pod에만 전달됩니다. 마찬가지로 글로벌 프로젝트의 포드는 모든 프로젝트의 모든 포드에서 아닌 다른 글로벌 프로젝트의 Pod에서 전송된 멀티 캐스트 패킷만 받습니다.
ovs-networkpolicy 플러그인을 사용하는 경우:
-
Pod에서 전송한 멀티 캐스트 패킷은
NetworkPolicy
오브젝트에 관계없이 프로젝트의 다른 모든 Pod로 전달됩니다. (포드가 유니캐스트를 통해 통신할 수 없는 경우에도 멀티 캐스트를 통해 통신할 수 있습니다.) -
한 프로젝트에서 Pod가 전송한 멀티 캐스트 패킷은 프로젝트 간에 통신을 허용하는
NetworkPolicy
오브젝트가 있더라도 다른 프로젝트의 Pod로 전달되지 않습니다.
8.10. NetworkPolicy 활성화
ovs-subnet 및 ovs-multitenant 플러그인에는 자체 레거시 네트워크 격리 모델이 있으며 Kubernetes NetworkPolicy를
지원하지 않습니다. 그러나 ovs-networkpolicy 플러그인을 사용하여 NetworkPolicy
지원을 사용할 수 있습니다.
Egress
정책 유형, ipBlock
매개변수, podSelector
및 namespaceSelector
매개변수를 결합하는 기능은 OpenShift Container Platform에서 사용할 수 없습니다.
클러스터와의 통신을 중단할 수 있으므로 기본 OpenShift Container Platform 프로젝트에 NetworkPolicy
기능을 적용하지 마십시오.
NetworkPolicy
규칙은 호스트 네트워크 네임스페이스에 적용되지 않습니다. 호스트 네트워킹이 활성화된 Pod는 NetworkPolicy
규칙의 영향을 받지 않습니다.
ovs-networkpolicy 플러그인을 사용하도록 구성된 클러스터에서 네트워크 격리는 NetworkPolicy
오브젝트에 의해 완전히 제어됩니다. 기본적으로 네트워크 정책 모드에서는 다른 Pod 및 네트워크 끝점에서 프로젝트의 모든 Pod에 액세스할 수 있습니다. 프로젝트에서 하나 이상의 Pod를 분리하기 위해 해당 프로젝트에서 NetworkPolicy
오브젝트를 생성하여 수신되는 연결을 표시할 수 있습니다. 프로젝트 관리자는 자신의 프로젝트 내에서 NetworkPolicy
오브젝트를 만들고 삭제할 수 있습니다.
NetworkPolicy 오브젝트를
가리키지 않는 Pod는 완전히 액세스할 수 있지만 하나 이상의 NetworkPolicy
오브젝트가 있는 Pod는 격리됩니다. 이러한 격리된 Pod는 NetworkPolicy
오브젝트 중 하나 이상에서 허용하는 연결만 허용합니다.
다음은 다양한 시나리오를 지원하는 몇 가지 샘플 NetworkPolicy
오브젝트 정의입니다.
모든 트래픽 거부
"기본적으로 거부" 프로젝트를 만들려면 모든 Pod와 일치하지만 트래픽을 허용하지 않는
NetworkPolicy
오브젝트를 추가합니다.kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata: name: deny-by-default spec: podSelector: ingress: []
프로젝트 내 Pod 연결만 수락
Pod가 동일한 프로젝트에 있는 다른 Pod의 연결은 수락하지만 다른 프로젝트의 Pod의 다른 모든 연결을 거부하도록 하려면 다음을 수행합니다.
kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata: name: allow-same-namespace spec: podSelector: ingress: - from: - podSelector: {}
Pod 레이블을 기반으로 하는 HTTP 및 HTTPS 트래픽만 허용
특정 레이블(다음 예에서
role=frontend
)을 사용하여 Pod에 대한 HTTP 및 HTTPS 액세스만 활성화하려면 다음과 유사한NetworkPolicy
오브젝트를 추가합니다.kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata: name: allow-http-and-https spec: podSelector: matchLabels: role: frontend ingress: - ports: - protocol: TCP port: 80 - protocol: TCP port: 443
NetworkPolicy
오브젝트는 추가 기능이므로 여러 NetworkPolicy
오브젝트를 결합하여 복잡한 네트워크 요구 사항을 충족할 수 있습니다.
예를 들어, 이전 샘플에서 정의된 NetworkPolicy
오브젝트의 경우 동일한 프로젝트 내에서 allow-same-namespace
정책과 allow-http-and-https
정책을 모두 정의할 수 있습니다. 따라서 레이블이 role=frontend
로 지정된 Pod는 각 정책에서 허용하는 모든 연결을 허용할 수 있습니다. 즉, 동일한 네임스페이스에 있는 Pod의 모든 포트 연결 및 모든 네임스페이스의 Pod에서 포트 80
및 443
에 대한 연결입니다.
8.10.1. NetworkPolicy를 효율적으로 사용
NetworkPolicy 오브젝트를
사용하면 네임스페이스 내에서 라벨별로 서로 다른 Pod를 격리할 수 있습니다.
NetworkPolicy
오브젝트를 단일 네임스페이스에서 개별 포드의 많은 수에 적용하는 것은 비효율적입니다. Pod 레이블은 IP 수준에 존재하지 않으므로 NetworkPolicy
오브젝트는 pod Selector
로 선택한 모든 Pod 간에 가능한 모든 링크에 대해 별도의 OVS 흐름 규칙을 생성합니다.
예를 들어 NetworkPolicy
오브젝트 내의 spec
podSelector
및 ingress
podSelector가
각각 200개의 Pod와 일치하면 40000(200*200) OVS 흐름 규칙이 생성됩니다. 이로 인해 머신이 느려질 수 있습니다.
OVS 흐름 규칙을 줄이려면 네임스페이스를 사용하여 격리해야 하는 포드 그룹을 포함합니다.
namespace Selectors 또는 빈
를 선택하는 podSelectors
를 사용하여 전체 네임스페이스NetworkPolicy
오브젝트는 네임스페이스의 VXLAN VNID와 일치하는 단일 OVS 흐름 규칙만 생성합니다.
원래 네임스페이스에서 분리할 필요가 없는 포드를 유지하고, 분리해야 하는 포드를 하나 이상의 네임스페이스로 이동합니다.
격리된 Pod에서 허용하려는 특정 트래픽을 허용하도록 추가 대상의 네임스페이스 간 정책을 생성합니다.
8.10.2. NetworkPolicy 및 라우터
ovs-multitenant 플러그인을 사용하는 경우 라우터의 트래픽이 모든 네임스페이스에 자동으로 허용됩니다. 라우터는 일반적으로 기본 네임스페이스에 있고 모든 네임스페이스에서 해당 네임스페이스의 포드에서 연결을 허용하기 때문입니다. ovs-networkpolicy 플러그인에서는 자동으로 수행되지 않습니다. 따라서 기본적으로 네임스페이스를 격리하는 정책이 있는 경우 라우터가 액세스할 수 있도록 추가 단계를 수행해야 합니다.
한 가지 옵션은 각 서비스에 대한 정책을 생성하여 모든 소스에서 액세스할 수 있도록 하는 것입니다. 예를 들면 다음과 같습니다.
kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata: name: allow-to-database-service spec: podSelector: matchLabels: role: database ingress: - ports: - protocol: TCP port: 5432
이렇게 하면 라우터가 서비스에 액세스할 수 있지만 다른 사용자의 네임스페이스의 포드도 액세스할 수 있습니다. 이러한 포드는 일반적으로 공용 라우터를 사용하여 서비스에 액세스할 수 있으므로 문제가 발생하지 않습니다.
또는 ovs-multitenant 플러그인과 같이 default 네임스페이스에서 전체 액세스를 허용하는 정책을 생성할 수 있습니다.
default 네임스페이스에 레이블을 추가합니다.
중요이전 절차의 default 레이블로
default
프로젝트에 레이블을 지정한 경우 이 단계를 건너뜁니다. 네임스페이스에 레이블을 추가하려면 클러스터 관리자 역할이 필요합니다.$ oc label namespace default name=default
해당 네임스페이스에서 연결을 허용하는 정책을 생성합니다.
참고연결을 허용하려는 각 네임스페이스에 대해 이 단계를 수행합니다. 프로젝트 관리자 역할이 있는 사용자는 정책을 생성할 수 있습니다.
kind: NetworkPolicy apiVersion: networking.k8s.io/v1 metadata: name: allow-from-default-namespace spec: podSelector: ingress: - from: - namespaceSelector: matchLabels: name: default
8.10.3. 새 프로젝트의 기본 NetworkPolicy 설정
클러스터 관리자는 새 프로젝트가 생성될 때마다 기본 NetworkPolicy
오브젝트(한 개 이상)의 자동 생성을 활성화하도록 기본 프로젝트 템플릿을 수정할 수 있습니다. 이 작업을 수행하려면 다음을 수행합니다.
- 사용자 지정 프로젝트 템플릿을 생성하고 마스터를 사용하도록 구성합니다.
default 라벨을 사용하여
default
프로젝트에레이블을 지정합니다
.중요이전 절차의 default 레이블로
default
프로젝트에 레이블을 지정한 경우 이 단계를 건너뜁니다. 네임스페이스에 레이블을 추가하려면 클러스터 관리자 역할이 필요합니다.$ oc label namespace default name=default
원하는
NetworkPolicy 오브젝트
를 포함하도록 템플릿을 편집합니다.$ oc edit template project-request -n default
참고기존 템플릿에
NetworkPolicy 오브젝트를
포함하려면oc edit
명령을 사용합니다. 현재는oc patch
를 사용하여 오브젝트를템플릿
리소스에 추가할 수 없습니다.각 기본 정책을
objects
배열의 요소로 추가합니다.objects: ... - apiVersion: networking.k8s.io/v1 kind: NetworkPolicy metadata: name: allow-from-same-namespace spec: podSelector: ingress: - from: - podSelector: {} - apiVersion: networking.k8s.io/v1 kind: NetworkPolicy metadata: name: allow-from-default-namespace spec: podSelector: ingress: - from: - namespaceSelector: matchLabels: name: default ...
8.11. HTTP Strict Transport Security 활성화
HSTS(HTTP Strict Transport Security) 정책은 보안 향상으로 호스트에서 HTTPS 트래픽만 허용합니다. 모든 HTTP 요청은 기본적으로 삭제됩니다. 이는 웹 사이트와의 안전한 상호 작용을 보장하거나 사용자의 이익을 위해 안전한 애플리케이션을 제공하는 데 유용합니다.
HSTS가 활성화되면 HSTS는 엄격한 전송 보안 헤더를 사이트의 HTTPS 응답에 추가합니다. 경로에서 insecureEdgeTerminationPolicy
값을 사용하여 HTTP를 HTTPS로 보내도록 경로를 재지정할 수 있습니다. 그러나 HSTS를 사용하면 클라이언트는 요청을 보내기 전에 HTTP URL의 모든 요청을 HTTPS로 변경하므로 리디렉션이 필요하지 않습니다. 클라이언트가 이를 지원할 필요는 없으며 max-age=0
을 설정하여 비활성화할 수 있습니다.
HSTS는 보안 경로(엣지 종료 또는 재암호화)에서만 작동합니다. HTTP 또는 패스스루(passthrough) 경로에서는 구성이 유효하지 않습니다.
경로에 HSTS를 활성화하려면 haproxy.router.openshift.io/hsts_header
값을 에지 종료에 추가하거나 경로를 다시 암호화합니다.
apiVersion: v1 kind: Route metadata: annotations: haproxy.router.openshift.io/hsts_header: max-age=31536000;includeSubDomains;preload
haproxy.router.openshift.io/hsts_header 값의 매개변수에
공백이 없고 다른 값이 없는지 확인합니다. max-age
만 필요합니다.
필수 max-age
매개 변수는 시간(초)을 나타내며 HSTS 정책이 에 적용됨을 나타냅니다. HSTS 헤더가 있는 응답이 호스트에서 수신될 때마다 클라이언트는 max-age
를 업데이트합니다. max-age
시간이 초과되면 클라이언트는 정책을 삭제합니다.
선택적 includeSubDomains
매개 변수는 호스트에 호스트의 모든 하위 도메인이 호스트와 동일하게 취급되도록 클라이언트에 지시합니다.
max-age
가 0보다 크면 선택적 preload
매개 변수를 사용하면 외부 서비스에서 이 사이트를 HSTS 사전 로드 목록에 포함할 수 있습니다. 예를 들어 Google과 같은 사이트는 preload
가 설정된 사이트 목록을 구성할 수 있습니다. 그런 다음 브라우저는 이러한 목록을 사용하여 사이트와 상호 작용하기 전에 HTTPS를 통해서만 통신할 사이트를 결정할 수 있습니다. 사전 로드
를 설정하지 않으면 헤더를 가져오려면 HTTPS를 통해 사이트와 통신해야 합니다.
8.12. 처리량 문제 해결
OpenShift Container Platform을 통해 애플리케이션을 배포하면 특정 서비스 간에 대기 시간이 비정상적으로 길어지는 등 네트워크 처리량 문제가 발생하는 경우가 있습니다.
Pod 로그에 문제의 원인이 드러나지 않는 경우 다음 방법으로 성능 문제를 분석하십시오.
ping 또는 tcpdump와 같은 패킷 Analyzer를 사용하여 pod와 해당 노드 간 트래픽을 분석합니다.
예를 들어, 각 pod에서 tcpdump 도구를 실행하여 문제의 원인이 되는 동작을 재현합니다. Pod와의 트래픽 대기 시간을 분석하기 위해 전송 및 수신 타임스탬프를 비교하려면 전송 캡처와 수신 캡처를 둘 다 검토하십시오. 다른 Pod, 스토리지 장치 또는 데이터 플레인의 트래픽으로 노드 인터페이스가 과부하된 경우 OpenShift Container Platform에서 대기 시간이 발생할 수 있습니다.
$ tcpdump -s 0 -i any -w /tmp/dump.pcap host <podip 1> && host <podip 2> 1
- 1
podip
은 Pod의 IP 주소입니다. 다음 명령을 실행하여 Pod의 IP 주소를 가져옵니다.
# oc get pod <podname> -o wide
tcpdump는 이 두 포드 간의 모든 트래픽을 포함하는 /tmp/dump.pcap 에 파일을 생성합니다. 문제가 재현되기 직전에 Analyzer를 실행하고 문제 재현이 종료된 직후 Analyzer를 중지하여 파일 크기를 최소화하는 것이 좋습니다. 다음을 사용하여 노드 간에 패킷 Analyzer를 실행할 수도 있습니다(방정식에서 SDN 제거).
# tcpdump -s 0 -i any -w /tmp/dump.pcap port 4789
- 스트리밍 처리량 및 UDP 처리량을 측정하려면 iperf와 같은 대역폭 측정 도구를 사용합니다. 먼저 포드에서 툴을 실행한 다음 노드에서 툴을 실행하여 병목 현상이 발생하는지 확인합니다. iperf3 도구는 RHEL 7의 일부로 포함되어 있습니다.
iperf3 설치 및 사용에 대한 자세한 내용은 다음 Red Hat 솔루션을 참조하십시오.
9장. 서비스 계정 구성
9.1. 개요
사용자가 OpenShift Container Platform CLI 또는 웹 콘솔을 사용하는 경우 해당 API 토큰은 OpenShift Container Platform API에 인증합니다. 그러나 일반 사용자의 자격 증명을 사용할 수 없는 경우 구성 요소를 독립적으로 API 호출하는 것이 일반적입니다. 예를 들면 다음과 같습니다.
- 복제 컨트롤러는 Pod를 생성하거나 삭제하기 위해 API를 호출합니다.
- 컨테이너 내부의 애플리케이션에서 검색 목적으로 API를 호출할 수 있습니다.
- 외부 애플리케이션에서는 모니터링 또는 통합을 위해 API를 호출할 수 있습니다.
서비스 계정을 사용하면 일반 사용자의 자격 증명을 공유하지 않고도 API 액세스 권한을 유연하게 제어할 수 있습니다.
9.2. 사용자 이름 및 그룹
모든 서비스 계정에는 일반 사용자와 마찬가지로 역할을 부여할 수 있는 관련 사용자 이름이 있습니다. 사용자 이름은 프로젝트 및 이름에서 파생됩니다.
system:serviceaccount:<project>:<name>
예를 들어, top-secret 개체에서 robot 서비스 계정에 view 역할을 추가하려면 다음을 수행합니다.
$ oc policy add-role-to-user view system:serviceaccount:top-secret:robot
프로젝트의 특정 서비스 계정에 대한 액세스 권한을 부여하려면 -z
플래그를 사용할 수 있습니다. 서비스 계정이 속하는 프로젝트에서 -z
플래그를 사용하고 <serviceaccount_name>
을 지정합니다. 이 방법은 오타를 방지하고 지정된 서비스 계정에만 액세스 권한을 부여하는 데 도움이 되므로 권장됩니다. 예를 들면 다음과 같습니다.
$ oc policy add-role-to-user <role_name> -z <serviceaccount_name>
프로젝트에 없는 경우 아래 예제와 같이 -n
옵션을 사용하여 적용되는 프로젝트 네임스페이스를 표시합니다.
모든 서비스 계정은 다음 두 그룹의 멤버이기도 합니다.
- system:serviceaccounts
- 시스템의 모든 서비스 계정이 포함됩니다.
- system:serviceaccounts:<project>
- 지정된 프로젝트의 모든 서비스 계정이 포함됩니다.
예를 들어, 모든 프로젝트의 모든 서비스 계정에서 top-secret 개체에 있는 모든 프로젝트의 리소스를 볼 수 있도록 하려면 다음을 실행합니다.
$ oc policy add-role-to-group view system:serviceaccounts -n top-secret
managers 프로젝트의 모든 서비스 계정에서 top-secret 개체의 리소스를 편집할 수 있도록 하려면 다음을 실행합니다.
$ oc policy add-role-to-group edit system:serviceaccounts:managers -n top-secret
9.3. 서비스 계정 관리
서비스 계정은 각 프로젝트 내에 존재하는 API 오브젝트입니다. 서비스 계정을 관리하려면 oc
명령을 sa
또는 serviceaccount
오브젝트 유형과 함께 사용하거나 웹 콘솔을 사용할 수 있습니다.
현재 프로젝트에서 기존 서비스 계정 목록을 가져오려면 다음을 수행합니다.
$ oc get sa NAME SECRETS AGE builder 2 2d default 2 2d deployer 2 2d
새 서비스 계정을 생성하려면 다음을 수행합니다.
$ oc create sa robot serviceaccount "robot" created
서비스 계정이 생성되는 즉시 다음 두 개의 시크릿이 자동으로 추가됩니다.
- API 토큰
- OpenShift Container Registry 인증 정보
이러한 계정은 서비스 계정을 설명하면 확인할 수 있습니다.
$ oc describe sa robot Name: robot Namespace: project1 Labels: <none> Annotations: <none> Image pull secrets: robot-dockercfg-qzbhb Mountable secrets: robot-token-f4khf robot-dockercfg-qzbhb Tokens: robot-token-f4khf robot-token-z8h44
시스템에서 서비스 계정에 항상 API 토큰 및 레지스트리 자격 증명이 있는지 확인합니다.
생성된 API 토큰 및 레지스트리 자격 증명은 만료되지 않지만 시크릿을 삭제하여 취소할 수 있습니다. 시크릿이 삭제되면 새 시크릿이 자동으로 생성되어 대체됩니다.
9.4. 서비스 계정 인증 활성화
서비스 계정은 개인 RSA 키에서 서명한 토큰을 사용하여 API에 인증합니다. 인증 계층은 일치하는 공개 RSA 키를 사용하여 서명을 확인합니다.
서비스 계정 토큰 생성을 활성화하려면 마스터의 /etc/origin/master/master-config.yml 파일에서 serviceAccountConfig
스탠자를 업데이트하여 privateKeyFile
(서브스크립션용) 및 publicKeyFiles
목록에 일치하는 공개 키 파일을 지정합니다.
serviceAccountConfig: ... masterCA: ca.crt 1 privateKeyFile: serviceaccount.private.key 2 publicKeyFiles: - serviceaccount.public.key 3 - ...
9.5. 관리형 서비스 계정
빌드, 배포 및 기타 포드를 실행하려면 각 프로젝트에 서비스 계정이 필요합니다. 마스터의 /etc/origin/master/master-config.yml 파일의 managedNames
설정은 모든 프로젝트에서 서비스 계정이 자동으로 생성되는지 제어합니다.
serviceAccountConfig: ... managedNames: 1 - builder 2 - deployer 3 - default 4 - ...
- 1
- 모든 프로젝트에서 자동으로 생성할 서비스 계정 목록입니다.
- 2
- 각 프로젝트의 빌더 서비스 계정은 빌드 포드에 필요하며, 내부 컨테이너 이미지 레지스트리를 사용하여 프로젝트의 모든 이미지 스트림으로 이미지를 푸시할 수 있는 system:image-builder 역할이 제공됩니다.
- 3
- 각 프로젝트의 배포자 서비스 계정은 배포 포드에 필요하며 system:deployer 역할이 부여되어 프로젝트에서 복제 컨트롤러 및 포드를 보고 수정할 수 있습니다.
- 4
- 다른 서비스 계정을 지정하지 않는 한 다른 모든 포드에서 기본 서비스 계정을 사용합니다.
프로젝트의 모든 서비스 계정에는 system:image-puller 역할이 부여되므로 내부 컨테이너 이미지 레지스트리를 사용하여 프로젝트의 모든 이미지 스트림에서 이미지를 가져올 수 있습니다.
9.6. 인프라 서비스 계정
다양한 인프라 컨트롤러가 서비스 계정 자격 증명을 사용하여 실행됩니다. 다음 서비스 계정은 서버 시작 시 OpenShift Container Platform 인프라 프로젝트(openshift-infra)에서 생성되며, 클러스터 전체에서 다음 역할이 제공됩니다.
서비스 계정 | 설명 |
---|---|
replication-controller | system:replication-controller 역할이 할당됨 |
deployment-controller | system:deployment-controller 역할이 할당됨 |
build-controller | system:build-controller 역할이 할당되었습니다. 또한 권한 있는 빌드 pod를 생성하기 위해 권한 있는 보안 컨텍스트 제약 조건에 build-controller 서비스 계정이 포함되어 있습니다. |
해당 서비스 계정이 생성되는 프로젝트를 구성하려면 마스터의 /etc/origin/master/master-config.yml 파일에서 openshiftInfrastructureNamespace
필드를 설정합니다.
policyConfig: ... openshiftInfrastructureNamespace: openshift-infra
9.7. 서비스 계정 및 시크릿
서비스 계정에서 포드 시크릿 참조를 허용 목록에 추가하도록 마스터의 /etc/origin/master/master-config.yml 파일의 limitSecretReferences
필드를 true
로 설정합니다. 포드에서 프로젝트의 보안을 참조할 수 있도록 해당 값을 false
로 설정합니다.
serviceAccountConfig: ... limitSecretReferences: false
10장. 역할 기반 액세스 제어(RBAC) 관리
10.1. 개요
10.2. 역할 및 바인딩 보기
역할을 사용하여 클러스터 전체 와 프로젝트 범위에서 다양한 수준의 액세스 권한을 부여할 수 있습니다. 사용자와 그룹은 동시에 여러 역할과 연결하거나 바인딩 할 수 있습니다. oc describe
명령을 사용하여 역할 및 해당 바인딩에 대한 세부 정보를 볼 수 있습니다.
cluster-admin 기본 클러스터 역할이 클러스터 전체에서 바인딩된 사용자는 모든 리소스에서 모든 작업을 수행할 수 있습니다. admin 기본 클러스터 역할이 로컬로 바인딩된 사용자는 해당 프로젝트의 역할 및 바인딩을 관리할 수 있습니다.
평가 권한 섹션에서 동사 전체 목록을 검토합니다.
10.2.1. 클러스터 역할 보기
클러스터 역할 및 관련 규칙 집합을 보려면 다음을 수행합니다.
$ oc describe clusterrole.rbac Name: admin Labels: <none> Annotations: openshift.io/description=A user that has edit rights within the project and can change the project's membership. rbac.authorization.kubernetes.io/autoupdate=true PolicyRule: Resources Non-Resource URLs Resource Names Verbs --------- ----------------- -------------- ----- appliedclusterresourcequotas [] [] [get list watch] appliedclusterresourcequotas.quota.openshift.io [] [] [get list watch] bindings [] [] [get list watch] buildconfigs [] [] [create delete deletecollection get list patch update watch] buildconfigs.build.openshift.io [] [] [create delete deletecollection get list patch update watch] buildconfigs/instantiate [] [] [create] buildconfigs.build.openshift.io/instantiate [] [] [create] buildconfigs/instantiatebinary [] [] [create] buildconfigs.build.openshift.io/instantiatebinary [] [] [create] buildconfigs/webhooks [] [] [create delete deletecollection get list patch update watch] buildconfigs.build.openshift.io/webhooks [] [] [create delete deletecollection get list patch update watch] buildlogs [] [] [create delete deletecollection get list patch update watch] buildlogs.build.openshift.io [] [] [create delete deletecollection get list patch update watch] builds [] [] [create delete deletecollection get list patch update watch] builds.build.openshift.io [] [] [create delete deletecollection get list patch update watch] builds/clone [] [] [create] builds.build.openshift.io/clone [] [] [create] builds/details [] [] [update] builds.build.openshift.io/details [] [] [update] builds/log [] [] [get list watch] builds.build.openshift.io/log [] [] [get list watch] configmaps [] [] [create delete deletecollection get list patch update watch] cronjobs.batch [] [] [create delete deletecollection get list patch update watch] daemonsets.extensions [] [] [get list watch] deploymentconfigrollbacks [] [] [create] deploymentconfigrollbacks.apps.openshift.io [] [] [create] deploymentconfigs [] [] [create delete deletecollection get list patch update watch] deploymentconfigs.apps.openshift.io [] [] [create delete deletecollection get list patch update watch] deploymentconfigs/instantiate [] [] [create] deploymentconfigs.apps.openshift.io/instantiate [] [] [create] deploymentconfigs/log [] [] [get list watch] deploymentconfigs.apps.openshift.io/log [] [] [get list watch] deploymentconfigs/rollback [] [] [create] deploymentconfigs.apps.openshift.io/rollback [] [] [create] deploymentconfigs/scale [] [] [create delete deletecollection get list patch update watch] deploymentconfigs.apps.openshift.io/scale [] [] [create delete deletecollection get list patch update watch] deploymentconfigs/status [] [] [get list watch] deploymentconfigs.apps.openshift.io/status [] [] [get list watch] deployments.apps [] [] [create delete deletecollection get list patch update watch] deployments.extensions [] [] [create delete deletecollection get list patch update watch] deployments.extensions/rollback [] [] [create delete deletecollection get list patch update watch] deployments.apps/scale [] [] [create delete deletecollection get list patch update watch] deployments.extensions/scale [] [] [create delete deletecollection get list patch update watch] deployments.apps/status [] [] [create delete deletecollection get list patch update watch] endpoints [] [] [create delete deletecollection get list patch update watch] events [] [] [get list watch] horizontalpodautoscalers.autoscaling [] [] [create delete deletecollection get list patch update watch] horizontalpodautoscalers.extensions [] [] [create delete deletecollection get list patch update watch] imagestreamimages [] [] [create delete deletecollection get list patch update watch] imagestreamimages.image.openshift.io [] [] [create delete deletecollection get list patch update watch] imagestreamimports [] [] [create] imagestreamimports.image.openshift.io [] [] [create] imagestreammappings [] [] [create delete deletecollection get list patch update watch] imagestreammappings.image.openshift.io [] [] [create delete deletecollection get list patch update watch] imagestreams [] [] [create delete deletecollection get list patch update watch] imagestreams.image.openshift.io [] [] [create delete deletecollection get list patch update watch] imagestreams/layers [] [] [get update] imagestreams.image.openshift.io/layers [] [] [get update] imagestreams/secrets [] [] [create delete deletecollection get list patch update watch] imagestreams.image.openshift.io/secrets [] [] [create delete deletecollection get list patch update watch] imagestreams/status [] [] [get list watch] imagestreams.image.openshift.io/status [] [] [get list watch] imagestreamtags [] [] [create delete deletecollection get list patch update watch] imagestreamtags.image.openshift.io [] [] [create delete deletecollection get list patch update watch] jenkins.build.openshift.io [] [] [admin edit view] jobs.batch [] [] [create delete deletecollection get list patch update watch] limitranges [] [] [get list watch] localresourceaccessreviews [] [] [create] localresourceaccessreviews.authorization.openshift.io [] [] [create] localsubjectaccessreviews [] [] [create] localsubjectaccessreviews.authorization.k8s.io [] [] [create] localsubjectaccessreviews.authorization.openshift.io [] [] [create] namespaces [] [] [get list watch] namespaces/status [] [] [get list watch] networkpolicies.extensions [] [] [create delete deletecollection get list patch update watch] persistentvolumeclaims [] [] [create delete deletecollection get list patch update watch] pods [] [] [create delete deletecollection get list patch update watch] pods/attach [] [] [create delete deletecollection get list patch update watch] pods/exec [] [] [create delete deletecollection get list patch update watch] pods/log [] [] [get list watch] pods/portforward [] [] [create delete deletecollection get list patch update watch] pods/proxy [] [] [create delete deletecollection get list patch update watch] pods/status [] [] [get list watch] podsecuritypolicyreviews [] [] [create] podsecuritypolicyreviews.security.openshift.io [] [] [create] podsecuritypolicyselfsubjectreviews [] [] [create] podsecuritypolicyselfsubjectreviews.security.openshift.io [] [] [create] podsecuritypolicysubjectreviews [] [] [create] podsecuritypolicysubjectreviews.security.openshift.io [] [] [create] processedtemplates [] [] [create delete deletecollection get list patch update watch] processedtemplates.template.openshift.io [] [] [create delete deletecollection get list patch update watch] projects [] [] [delete get patch update] projects.project.openshift.io [] [] [delete get patch update] replicasets.extensions [] [] [create delete deletecollection get list patch update watch] replicasets.extensions/scale [] [] [create delete deletecollection get list patch update watch] replicationcontrollers [] [] [create delete deletecollection get list patch update watch] replicationcontrollers/scale [] [] [create delete deletecollection get list patch update watch] replicationcontrollers.extensions/scale [] [] [create delete deletecollection get list patch update watch] replicationcontrollers/status [] [] [get list watch] resourceaccessreviews [] [] [create] resourceaccessreviews.authorization.openshift.io [] [] [create] resourcequotas [] [] [get list watch] resourcequotas/status [] [] [get list watch] resourcequotausages [] [] [get list watch] rolebindingrestrictions [] [] [get list watch] rolebindingrestrictions.authorization.openshift.io [] [] [get list watch] rolebindings [] [] [create delete deletecollection get list patch update watch] rolebindings.authorization.openshift.io [] [] [create delete deletecollection get list patch update watch] rolebindings.rbac.authorization.k8s.io [] [] [create delete deletecollection get list patch update watch] roles [] [] [create delete deletecollection get list patch update watch] roles.authorization.openshift.io [] [] [create delete deletecollection get list patch update watch] roles.rbac.authorization.k8s.io [] [] [create delete deletecollection get list patch update watch] routes [] [] [create delete deletecollection get list patch update watch] routes.route.openshift.io [] [] [create delete deletecollection get list patch update watch] routes/custom-host [] [] [create] routes.route.openshift.io/custom-host [] [] [create] routes/status [] [] [get list watch update] routes.route.openshift.io/status [] [] [get list watch update] scheduledjobs.batch [] [] [create delete deletecollection get list patch update watch] secrets [] [] [create delete deletecollection get list patch update watch] serviceaccounts [] [] [create delete deletecollection get list patch update watch impersonate] services [] [] [create delete deletecollection get list patch update watch] services/proxy [] [] [create delete deletecollection get list patch update watch] statefulsets.apps [] [] [create delete deletecollection get list patch update watch] subjectaccessreviews [] [] [create] subjectaccessreviews.authorization.openshift.io [] [] [create] subjectrulesreviews [] [] [create] subjectrulesreviews.authorization.openshift.io [] [] [create] templateconfigs [] [] [create delete deletecollection get list patch update watch] templateconfigs.template.openshift.io [] [] [create delete deletecollection get list patch update watch] templateinstances [] [] [create delete deletecollection get list patch update watch] templateinstances.template.openshift.io [] [] [create delete deletecollection get list patch update watch] templates [] [] [create delete deletecollection get list patch update watch] templates.template.openshift.io [] [] [create delete deletecollection get list patch update watch] Name: basic-user Labels: <none> Annotations: openshift.io/description=A user that can get basic information about projects. rbac.authorization.kubernetes.io/autoupdate=true PolicyRule: Resources Non-Resource URLs Resource Names Verbs --------- ----------------- -------------- ----- clusterroles [] [] [get list] clusterroles.authorization.openshift.io [] [] [get list] clusterroles.rbac.authorization.k8s.io [] [] [get list watch] projectrequests [] [] [list] projectrequests.project.openshift.io [] [] [list] projects [] [] [list watch] projects.project.openshift.io [] [] [list watch] selfsubjectaccessreviews.authorization.k8s.io [] [] [create] selfsubjectrulesreviews [] [] [create] selfsubjectrulesreviews.authorization.openshift.io [] [] [create] storageclasses.storage.k8s.io [] [] [get list] users [] [~] [get] users.user.openshift.io [] [~] [get] Name: cluster-admin Labels: <none> Annotations: authorization.openshift.io/system-only=true openshift.io/description=A super-user that can perform any action in the cluster. When granted to a user within a project, they have full control over quota and membership and can perform every action... rbac.authorization.kubernetes.io/autoupdate=true PolicyRule: Resources Non-Resource URLs Resource Names Verbs --------- ----------------- -------------- ----- [*] [] [*] *.* [] [] [*] Name: cluster-debugger Labels: <none> Annotations: authorization.openshift.io/system-only=true rbac.authorization.kubernetes.io/autoupdate=true PolicyRule: Resources Non-Resource URLs Resource Names Verbs --------- ----------------- -------------- ----- [/debug/pprof] [] [get] [/debug/pprof/*] [] [get] [/metrics] [] [get] Name: cluster-reader Labels: <none> Annotations: authorization.openshift.io/system-only=true rbac.authorization.kubernetes.io/autoupdate=true PolicyRule: Resources Non-Resource URLs Resource Names Verbs --------- ----------------- -------------- ----- [*] [] [get] apiservices.apiregistration.k8s.io [] [] [get list watch] apiservices.apiregistration.k8s.io/status [] [] [get list watch] appliedclusterresourcequotas [] [] [get list watch] ...
10.2.2. 클러스터 역할 바인딩 보기
다양한 역할에 바인딩된 사용자와 그룹을 표시하는 현재 클러스터 역할 바인딩 세트를 보려면 다음을 수행합니다.
$ oc describe clusterrolebinding.rbac Name: admin Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: admin Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount template-instance-controller openshift-infra Name: basic-users Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: basic-user Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Name: cluster-admin Labels: kubernetes.io/bootstrapping=rbac-defaults Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: cluster-admin Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount pvinstaller default Group system:masters Name: cluster-admins Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: cluster-admin Subjects: Kind Name Namespace ---- ---- --------- Group system:cluster-admins User system:admin Name: cluster-readers Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: cluster-reader Subjects: Kind Name Namespace ---- ---- --------- Group system:cluster-readers Name: cluster-status-binding Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: cluster-status Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Group system:unauthenticated Name: registry-registry-role Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:registry Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount registry default Name: router-router-role Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:router Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount router default Name: self-access-reviewers Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: self-access-reviewer Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Group system:unauthenticated Name: self-provisioners Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: self-provisioner Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated:oauth Name: system:basic-user Labels: kubernetes.io/bootstrapping=rbac-defaults Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:basic-user Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Group system:unauthenticated Name: system:build-strategy-docker-binding Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:build-strategy-docker Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Name: system:build-strategy-jenkinspipeline-binding Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:build-strategy-jenkinspipeline Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Name: system:build-strategy-source-binding Labels: <none> Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:build-strategy-source Subjects: Kind Name Namespace ---- ---- --------- Group system:authenticated Name: system:controller:attachdetach-controller Labels: kubernetes.io/bootstrapping=rbac-defaults Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:controller:attachdetach-controller Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount attachdetach-controller kube-system Name: system:controller:certificate-controller Labels: kubernetes.io/bootstrapping=rbac-defaults Annotations: rbac.authorization.kubernetes.io/autoupdate=true Role: Kind: ClusterRole Name: system:controller:certificate-controller Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount certificate-controller kube-system Name: system:controller:cronjob-controller Labels: kubernetes.io/bootstrapping=rbac-defaults Annotations: rbac.authorization.kubernetes.io/autoupdate=true ...
10.2.3. 로컬 역할 및 바인딩 보기
모든 기본 클러스터 역할은 사용자 또는 그룹에 로컬로 바인딩할 수 있습니다.
사용자 지정 로컬 역할을 만들 수 있습니다.
로컬 역할 바인딩도 볼 수 있습니다.
다양한 역할에 바인딩된 사용자와 그룹을 표시하는 로컬 역할 바인딩의 현재 집합을 보려면 다음을 수행합니다.
$ oc describe rolebinding.rbac
기본적으로 로컬 역할 바인딩을 볼 때 현재 프로젝트가 사용됩니다. 또는 -n
플래그를 사용하여 프로젝트를 지정할 수 있습니다. 이 기능은 사용자에게 이미 admin 기본 클러스터 역할이 있는 경우 다른 프로젝트의 로컬 역할 바인딩을 확인하는 데 유용합니다.
$ oc describe rolebinding.rbac -n joe-project Name: admin Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: admin Subjects: Kind Name Namespace ---- ---- --------- User joe Name: system:deployers Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:deployer Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount deployer joe-project Name: system:image-builders Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:image-builder Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount builder joe-project Name: system:image-pullers Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:image-puller Subjects: Kind Name Namespace ---- ---- --------- Group system:serviceaccounts:joe-project
10.3. 역할 바인딩 관리
사용자 또는 그룹에 역할을 추가하거나 바인딩 하면 역할 에서 부여하는 관련 액세스 권한이 사용자 또는 그룹에 부여됩니다. oc adm policy
명령을 사용하여 사용자 및 그룹에 역할을 추가하거나 사용자 및 그룹으로부터 역할을 제거할 수 있습니다.
다음 작업을 사용하여 로컬 역할 바인딩에 대한 사용자 또는 그룹의 연결된 역할을 관리할 때 -n
플래그로 프로젝트를 지정할 수 있습니다. 지정하지 않으면 현재 프로젝트가 사용됩니다.
명령 | 설명 |
---|---|
| 리소스에 작업을 수행할 수 있는 사용자를 나타냅니다. |
| 지정된 역할을 현재 프로젝트의 지정된 사용자에게 바인딩합니다. |
| 현재 프로젝트에서 지정된 사용자로부터 지정된 역할을 제거합니다. |
| 현재 프로젝트에서 지정된 사용자 및 해당 사용자의 역할을 모두 제거합니다. |
| 현재 프로젝트에서 지정된 그룹에 지정된 역할을 바인딩합니다. |
| 현재 프로젝트에서 지정된 그룹의 지정된 역할을 제거합니다. |
| 현재 프로젝트에서 지정된 그룹과 해당 그룹의 역할을 모두 제거합니다. |
|
|
다음 작업을 사용하여 클러스터 역할 바인딩을 관리할 수도 있습니다. 클러스터 역할 바인딩에 네임스페이스가 아닌 리소스가 사용되므로 -n
플래그가 해당 작업에 사용되지 않습니다.
명령 | 설명 |
---|---|
| 클러스터의 모든 프로젝트에 대해 지정된 사용자에게 지정된 역할을 바인딩합니다. |
| 클러스터의 모든 프로젝트에 대해 지정된 사용자로부터 지정된 역할을 제거합니다. |
| 클러스터의 모든 프로젝트에 대해 지정된 역할을 지정된 그룹에 바인딩합니다. |
| 클러스터의 모든 프로젝트에 대해 지정된 그룹에서 지정된 역할을 제거합니다. |
|
|
예를 들어 다음을 실행하여 joe-project 의 alice 사용자에게 admin 역할을 추가할 수 있습니다.
$ oc adm policy add-role-to-user admin alice -n joe-project
그런 다음 로컬 역할 바인딩을 보고 출력에 추가되었는지 확인할 수 있습니다.
$ oc describe rolebinding.rbac -n joe-project Name: admin Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: admin Subjects: Kind Name Namespace ---- ---- --------- User joe Name: admin-0 1 Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: admin Subjects: Kind Name Namespace ---- ---- --------- User alice 2 Name: system:deployers Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:deployer Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount deployer joe-project Name: system:image-builders Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:image-builder Subjects: Kind Name Namespace ---- ---- --------- ServiceAccount builder joe-project Name: system:image-pullers Labels: <none> Annotations: <none> Role: Kind: ClusterRole Name: system:image-puller Subjects: Kind Name Namespace ---- ---- --------- Group system:serviceaccounts:joe-project
10.4. 로컬 역할 생성
프로젝트의 로컬 역할을 생성하여 이 역할을 사용자에게 바인딩할 수 있습니다.
프로젝트의 로컬 역할을 생성하려면 다음 명령을 실행합니다.
$ oc create role <name> --verb=<verb> --resource=<resource> -n <project>
이 명령에서는 역할이 *
<
를 지정합니다. 프로젝트 이름project>에
>적용되는 리소스
인 *<name
>에 적용할 동사의 쉼표로 구분된 목록인 * <verb+ 예를 들어 사용자가
blue
프로젝트의 Pod를 볼 수 있는 로컬 역할을 생성하려면 다음 명령을 실행합니다.+
$ oc create role podview --verb=get --resource=pod -n blue
- 새 역할을 사용자에게 바인딩하려면 다음 명령을 실행합니다.
$ oc adm policy add-role-to-user podview user2 --role-namespace=blue -n blue
10.5. 클러스터 역할 생성
클러스터 역할을 만들려면 다음 명령을 실행합니다.
$ oc create clusterrole <name> --verb=<verb> --resource=<resource>
이 명령에서는 다음을 지정합니다.
-
<name>
: 로컬 역할 이름 -
<verb>
: 역할에 적용할 동사를 쉼표로 구분한 목록 -
<resource>
: 역할이 적용되는 리소스
예를 들어 사용자가 pod를 볼 수 있는 클러스터 역할을 만들려면 다음 명령을 실행합니다.
$ oc create clusterrole podviewonly --verb=get --resource=pod
10.6. 클러스터 및 로컬 역할 바인딩
클러스터 역할 바인딩은 클러스터 수준에 존재하는 바인딩입니다. 역할 바인딩은 프로젝트 수준에 있습니다. 해당 사용자가 프로젝트를 보려면 로컬 역할 바인딩을 사용하여 클러스터 역할 보기를 사용자에게 바인딩해야 합니다. 클러스터 역할이 특정 상황에 필요한 권한 집합을 제공하지 않는 경우에만 로컬 역할을 생성하십시오.
일부 클러스터 역할 이름은 처음에는 혼동을 줍니다. 로컬 역할 바인딩을 사용하여 cluster-admin
을 사용자에게 바인딩하여 이 사용자에게 클러스터 관리자 권한이 있음을 나타낼 수 있습니다. 사실은 그렇지 않습니다. cluster-admin
을 특정 프로젝트에 바인딩하는 것은 해당 프로젝트의 슈퍼 관리자와 더 유사하며, 클러스터 역할 관리자의
권한을 부여하고 속도 제한을 편집하는 기능과 같은 몇 가지 추가 권한을 부여합니다. 이는 특히 진정한 클러스터 관리자에게 바인딩된 클러스터 역할 바인딩이 나열되지 않는 웹 콘솔 UI를 통해 혼동될 수 있습니다. 그러나 cluster-admin
을 로컬로 바인딩하는 데 사용할 수 있는 로컬 역할 바인딩은 나열됩니다.
10.7. 정책 정의 업데이트
클러스터를 업그레이드하는 동안 마스터를 다시 시작할 때마다 기본 클러스터 역할이 자동으로 조정되어 누락된 권한을 복원합니다.
기본 클러스터 역할을 사용자 지정하고 역할 조정이 수정되지 않도록 하려면 다음을 수행하십시오.
조정으로부터 각 역할을 보호합니다.
$ oc annotate clusterrole.rbac <role_name> --overwrite rbac.authorization.kubernetes.io/autoupdate=false
주의업그레이드 후 신규 또는 필수 권한을 포함하도록 이 설정이 포함된 역할을 수동으로 업데이트해야 합니다.
기본 부트스트랩 정책 템플릿 파일을 생성합니다.
$ oc adm create-bootstrap-policy-file --filename=policy.json
참고파일의 내용은 OpenShift Container Platform 버전에 따라 다르지만 파일에는 기본 정책만 포함되어 있습니다.
- 클러스터 역할 사용자 지정을 포함하도록 policy.json 파일을 업데이트합니다.
정책 파일을 사용하여 보호되지 않은 역할 및 역할 바인딩을 자동으로 조정합니다.
$ oc auth reconcile -f policy.json
보안 컨텍스트 제약 조건을 조정합니다.
# oc adm policy reconcile-sccs \ --additive-only=true \ --confirm
11장. 이미지 정책
11.1. 개요
클러스터에서 가져오고, 태그를 지정하고, 실행할 수 있는 이미지를 제어할 수 있습니다. 이 목적을 위해 두 가지 기능이 있습니다.
가져오기에 허용되는 레지스트리 는 이미지 원본을 특정 외부 레지스트리 세트로 제한할 수 있는 이미지 정책 구성입니다. 이 규칙 세트는 이미지 스트림으로 가져오거나 태그하는 이미지에 적용됩니다. 따라서 규칙 집합과 일치하지 않는 이미지가 규칙 집합과 일치하지 않는 이미지는 거부됩니다.
ImagePolicy 승인 플러그인을 사용하면 클러스터에서 실행할 수 있는 이미지를 지정할 수 있습니다. 현재 베타로 간주됩니다. 이를 통해 다음을 제어할 수 있습니다.
- 이미지 소스: 이미지를 가져오는 데 사용할 수 있는 레지스트리
- 이미지 해상도: 변경 불가능한 다이제스트와 함께 Pod를 실행하여 재태그로 인해 이미지가 변경되지 않도록 강제 적용합니다.
- 컨테이너 이미지 레이블 제한 사항: 이미지에 대한 라벨 제한 또는 필요
- 이미지 주석 제한: 통합 컨테이너 이미지 레지스트리의 이미지에 주석이 제한되거나 필요
11.2. 가져올 수 있는 레지스트리 구성
다음 예에 설명된 대로 imagePolicyConfig:allowedRegistriesForImport
섹션의 master-config.yaml 에서 가져올 수 있는 레지스트리를 구성할 수 있습니다. 설정이 없으면 모든 이미지가 허용되며 이는 기본값입니다.
예 11.1. 가져올 수 있는 레지스트리 구성 예
imagePolicyConfig: allowedRegistriesForImport: - domainName: registry.redhat.io 1 - domainName: *.mydomain.com insecure: true 2 - domainName: local.registry.corp:5000 3
각 규칙은 다음 특성으로 구성됩니다.
-
domainname
: 특수 와일드카드 문자 (?
,*
)가 인식되는:<port>
접미사가 선택적으로 종료되는 호스트 이름입니다. 전자는 모든 길이의 문자 시퀀스와 일치하고, 나중에는 정확히 하나의 문자와 일치합니다. 와일드카드 문자는:
구분 기호 앞뒤로 존재할 수 있습니다. 와일드카드는 구분 기호의 존재 여부와 관계없이 구분 기호 앞뒤 부분에만 적용됩니다. -
insecure
:domainName
에서:<port>
부분이 누락된 경우 일치하는 포트를 결정하는 데 사용되는 부울입니다. true인 경우, 비보안 플래그를 가져오는 동안에는domainName
이:80
접미사 또는 지정되지 않은 포트가 있는 레지스트리와 일치합니다. false인 경우접미사
또는 지정되지 않은 포트가 있는 레지스트리가 일치합니다.
규칙이 동일한 도메인의 보안 및 비보안 포트와 일치해야 하는 경우 규칙이 두 번 나열되어야 합니다(insecure =true로 한 번,
를 한 번 사용).
insecure=
false
정규화되지 않은 이미지 참조는 규칙 평가 전에 docker.io
에 자격을 부여합니다. 허용 목록에 domainName: docker.io
를 사용합니다.
domainname: *
규칙은 모든 레지스트리 호스트 이름과 일치하지만 포트는 여전히 443
으로 제한됩니다. 임의의 포트에서 임의의 레지스트리 서비스를 제공하는 것과 일치하려면 domainName: *: *
를 사용합니다.
가져올 수 있는 레지스트리의 예제 구성에 설정된 규칙에 따라:
-
oc tag --insecure reg.mydomain.com/app:v1 app:v1
은mydomain.com 규칙을 처리하여 허용 목록에 표시됩니다.
-
oc import-image --from reg1.mydomain.com:80/foo foo:latest
도 허용 목록에 표시됩니다. -
포트가 세 번째 규칙의
5000
과 일치하지 않기 때문에oc tag local.registry.corp/bar bar:latest
가 거부됩니다.
거부된 이미지 가져오기는 다음 텍스트와 유사한 오류 메시지를 생성합니다.
The ImageStream "bar" is invalid: * spec.tags[latest].from.name: Forbidden: registry "local.registry.corp" not allowed by whitelist: "local.registry.corp:5000", "*.mydomain.com:80", "registry.redhat.io:443" * status.tags[latest].items[0].dockerImageReference: Forbidden: registry "local.registry.corp" not allowed by whitelist: "local.registry.corp:5000", "*.mydomain.com:80", "registry.redhat.io:443"
11.3. ImagePolicy 승인 플러그인 구성
클러스터에서 실행할 수 있는 이미지를 구성하려면 master-config.yaml
파일에서 ImagePolicy 승인 플러그인을 구성합니다. 필요에 따라 하나 이상의 규칙을 설정할 수 있습니다.
특정 주석이 있는 이미지를 거부합니다.
이 규칙을 사용하여 특정 주석이 설정된 이미지를 모두 거부합니다. 다음은
images.openshift.io/deny-execution
주석을 사용하여 모든 이미지를 거부합니다.- name: execution-denied onResources: - resource: pods - resource: builds reject: true matchImageAnnotations: - key: images.openshift.io/deny-execution 1 value: "true" skipOnResolutionFailure: true
- 1
- 특정 이미지가 해로운 것으로 간주된 경우 관리자는 이 주석을 설정하여 해당 이미지에 플래그를 지정할 수 있습니다.
사용자가 Docker Hub에서 이미지를 실행할 수 있도록 활성화합니다.
사용자가 Docker Hub의 이미지를 사용할 수 있도록 하려면 이 규칙을 사용합니다.
- name: allow-images-from-dockerhub onResources: - resource: pods - resource: builds matchRegistries: - docker.io
다음은 master-config.yaml 파일에서 여러 ImagePolicy 추가 기능 플러그인 규칙을 설정하는 구성 예입니다.
주석이 있는 예제 파일
admissionConfig: pluginConfig: openshift.io/ImagePolicy: configuration: kind: ImagePolicyConfig apiVersion: v1 resolveImages: AttemptRewrite 1 executionRules: 2 - name: execution-denied # Reject all images that have the annotation images.openshift.io/deny-execution set to true. # This annotation may be set by infrastructure that wishes to flag particular images as dangerous onResources: 3 - resource: pods - resource: builds reject: true 4 matchImageAnnotations: 5 - key: images.openshift.io/deny-execution value: "true" skipOnResolutionFailure: true 6 - name: allow-images-from-internal-registry # allows images from the internal registry and tries to resolve them onResources: - resource: pods - resource: builds matchIntegratedRegistry: true - name: allow-images-from-dockerhub onResources: - resource: pods - resource: builds matchRegistries: - docker.io resolutionRules: 7 - targetResource: resource: pods localNames: true policy: AttemptRewrite - targetResource: 8 group: batch resource: jobs localNames: true 9 policy: AttemptRewrite
- 1
- 이미지를 변경할 수 없는 이미지 다이제스트로 확인하고 Pod의 이미지 가져오기 사양을 업데이트합니다.
- 2
- 들어오는 리소스에 대해 평가할 규칙 배열입니다.
reject: true
규칙만 있는 경우 기본값은 모두 허용됩니다. 수락 규칙이 있는 경우 규칙에서reject: false인
ImagePolicy의 기본 동작이 deny-all 로 전환됩니다. - 3
- 규칙을 적용할 리소스를 나타냅니다. 아무것도 지정되지 않은 경우 기본값은 pods 입니다.
- 4
- 이 규칙이 일치하면 포드가 거부되어야 함을 나타냅니다.
- 5
- 이미지 오브젝트의 메타데이터와 일치시킬 주석 목록입니다.
- 6
- 이미지를 확인할 수 없는 경우 포드에 실패하지 마십시오.
- 7
- Kubernetes 리소스에서 이미지 스트림을 사용하도록 허용하는 규칙 배열입니다. 기본 구성을 사용하면 Pod, replicationcontrollers, replicasets, statefulsets, daemonsets, 배포 및 작업이 이미지 필드에서 동일한 프로젝트 이미지 스트림 태그 참조를 사용할 수 있습니다.
- 8
- 이 규칙이 적용되는 그룹 및 리소스를 식별합니다. resource가
*
이면 이 규칙은 해당 그룹의 모든 리소스에 적용됩니다. - 9
LocalNames
는 리소스 또는 대상 이미지 스트림에로컬 이름 확인이
활성화된 경우에만 단일 세그먼트 이름(예: ruby:2.5
)을 네임스페이스-로컬 이미지 스트림 태그로 해석할 수 있습니다.
일반적으로 기본 레지스트리 접두사(예: docker.io 또는 registry.redhat.io )를 사용하여 가져오는 인프라 이미지를 사용하는 경우 해당 이미지는 레지스트리 접두사가 없으므로 matchRegistries
값과 일치하지 않습니다. 인프라 이미지에 이미지 정책과 일치하는 레지스트리 접두사가 있도록 하려면 master-config .yaml 파일에 imageConfig. format
값을 설정합니다.
11.4. Admission Controller를 사용하여 항상 이미지 가져오기
이미지를 노드로 가져온 후 사용자의 해당 노드의 모든 Pod는 이미지에 대한 권한 부여 확인 없이 이미지를 사용할 수 있습니다. Pod에서 인증 정보가 없는 이미지를 사용하지 않도록 하려면 AlwaysPullImages 승인 컨트롤러를 사용합니다.
이 승인 컨트롤러는 모든 새 Pod를 수정하여 이미지 가져오기 정책을 Always
로 강제 적용하므로 Pod 사양에서 Never
의 이미지 가져오기 정책을 사용하는 경우에도 개인 이미지를 가져올 자격 증명이 있는 사용자만 사용할 수 있습니다.
AlwaysPullImages 승인 컨트롤러를 활성화하려면 다음을 수행합니다.
master-config.yaml에 다음을 추가합니다.
admissionConfig: pluginConfig: AlwaysPullImages: 1 configuration: kind: DefaultAdmissionConfig apiVersion: v1 disable: false 2
master
-restart 명령을 사용하여 컨트롤 플레인 정적 Pod에서 실행 중인 마스터
서비스를 다시 시작합니다.$ master-restart api $ master-restart controllers
11.5. ImagePolicy 승인 플러그인 테스트
openshift/image-policy-check
를 사용하여 구성을 테스트합니다.예를 들어 위의 정보를 사용한 다음 다음과 같이 테스트합니다.
$ oc import-image openshift/image-policy-check:latest --confirm
이 YAML을 사용하여 포드를 생성합니다. 포드가 생성되어야 합니다.
apiVersion: v1 kind: Pod metadata: generateName: test-pod spec: containers: - image: docker.io/openshift/image-policy-check:latest name: first
다른 레지스트리를 가리키는 다른 포드를 생성합니다. 포드는 거부해야 합니다.
apiVersion: v1 kind: Pod metadata: generateName: test-pod spec: containers: - image: different-registry/openshift/image-policy-check:latest name: first
가져온 이미지를 사용하여 내부 레지스트리를 가리키는 포드를 생성합니다. 포드가 생성되어야 하며 이미지 사양을 보면 태그 대신 다이제스트가 표시되어야 합니다.
apiVersion: v1 kind: Pod metadata: generateName: test-pod spec: containers: - image: <internal registry IP>:5000/<namespace>/image-policy-check:latest name: first
가져온 이미지를 사용하여 내부 레지스트리를 가리키는 포드를 생성합니다. 포드가 생성되어야 하며 이미지 사양을 보는 경우 태그가 수정되지 않아야 합니다.
apiVersion: v1 kind: Pod metadata: generateName: test-pod spec: containers: - image: <internal registry IP>:5000/<namespace>/image-policy-check:v1 name: first
oc get istag/image-policy-check:latest
에서 다이제스트를 가져와서oc 주석 images/<digest> images.openshift.io/deny-execution=true
에 사용합니다. 예를 들면 다음과 같습니다.$ oc annotate images/sha256:09ce3d8b5b63595ffca6636c7daefb1a615a7c0e3f8ea68e5db044a9340d6ba8 images.openshift.io/deny-execution=true
이 Pod를 다시 생성하면 Pod가 거부되어야 합니다.
apiVersion: v1 kind: Pod metadata: generateName: test-pod spec: containers: - image: <internal registry IP>:5000/<namespace>/image-policy-check:latest name: first
12장. 이미지 서명
12.1. 개요
RHEL(Red Hat Enterprise Linux) 시스템의 컨테이너 이미지 서명은 다음과 같은 수단을 제공합니다.
- 컨테이너 이미지가 제공된 위치 확인
- 이미지가 로 변조되지 않았는지 확인하고,
- 호스트로 가져올 수 있는 유효성 있는 이미지를 결정하는 정책을 설정합니다.
RHEL 시스템에서 컨테이너 이미지 서명 아키텍처에 대한 자세한 내용은 컨테이너 이미지 서명 통합 가이드를 참조하십시오.
OpenShift Container Registry를 사용하면 REST API를 통해 서명을 저장할 수 있습니다. oc
CLI는 웹 콘솔 또는 CLI에 유효성이 검사되어 이미지 서명을 확인하는 데 사용할 수 있습니다.
12.2. Atomic CLI를 사용하여 이미지 서명
OpenShift Container Platform은 이미지 서명을 자동화하지 않습니다. 서명하려면 개발자의 개인 GPG 키가 필요하며, 일반적으로 워크스테이션에 안전하게 저장됩니다. 이 문서에서는 워크플로를 설명합니다.
버전 1.12.5 이상인 atomic
명령행 인터페이스(CLI)는 OpenShift Container Registry로 푸시할 수 있는 컨테이너 이미지에 서명하는 명령을 제공합니다. atomic
CLI는 Red Hat 기반 배포에서 사용할 수 있습니다. RHEL, pvcos 및 Fedora. atomic
CLI는 RHEL Atomic Host 시스템에 사전 설치되어 있습니다. RHEL 호스트에 atomic 패키지 설치에 대한 자세한 내용은 이미지 서명 지원 활성화를 참조하십시오.
atomic
CLI는 oc 로그인
에서 인증된 자격 증명을 사용합니다. atomic
및 oc
명령 모두에 대해 동일한 호스트에서 동일한 사용자를 사용해야 합니다. 예를 들어 sudo로
원자
성 CLI를 실행하는 경우 sudooc login
을 사용하여 OpenShift Container Platform에 로그인해야 합니다.
이미지에 서명을 연결하려면 사용자에게 image-signer
클러스터 역할이 있어야 합니다. 클러스터 관리자는 다음을 사용하여 이를 추가할 수 있습니다.
$ oc adm policy add-cluster-role-to-user system:image-signer <user_name>
이미지는 푸시 시 서명될 수 있습니다.
$ atomic push [--sign-by <gpg_key_id>] --type atomic <image>
서명은 atomic
전송 유형 인수가 지정되면 OpenShift Container Platform에 저장됩니다. 자세한 내용은 서명 전송에서 참조하십시오.
원자
성 CLI를 사용하여 이미지 서명을 설정하고 수행하는 방법에 대한 자세한 내용은 RHEL Atomic Host Managing Containers를 참조하십시오. 컨테이너 이미지 설명서 또는 인수 세부 정보는 atomic push --help
출력에 서명합니다.
원자
성 CLI 및 OpenShift Container Registry로 작업하는 특정 예제 워크플로는 컨테이너 이미지 서명 통합 가이드에 설명되어 있습니다.
12.3. OpenShift CLI를 사용하여 이미지 서명 확인
oc adm verify-image-signature
명령을 사용하여 OpenShift Container Registry로 가져온 이미지의 서명을 확인할 수 있습니다. 이 명령은 공개 GPG 키를 사용하여 서명 자체를 확인하여 이미지 서명에 포함된 이미지 ID를 신뢰할 수 있는지 여부를 확인하고 제공된 예상 ID와 지정된 이미지의 ID(pull spec)와 일치시킵니다.
기본적으로 이 명령은 경로 ~/.gnupg 에 있는 공개 GPG 인증 키를 $GNUPGHOME/pubring.gpg 에 사용합니다. 기본적으로 이 명령은 확인 결과를 이미지 오브젝트로 다시 저장하지 않습니다. 이렇게 하려면 다음과 같이 --save
플래그를 지정해야 합니다.
이미지 서명을 확인하려면 사용자에게 image-auditor
클러스터 역할이 있어야 합니다. 클러스터 관리자는 다음을 사용하여 이를 추가할 수 있습니다.
$ oc adm policy add-cluster-role-to-user system:image-auditor <user_name>
잘못된 GPG 키 또는 유효하지 않은 ID와 함께 이미 확인된 이미지에 --save
플래그를 사용하면 저장된 확인 상태와 모든 서명이 제거되고 이미지가 확인되지 않습니다.
모든 서명을 실수로 삭제하지 않도록 하려면 --save
플래그 없이 명령을 실행하고 잠재적인 문제가 있는지 로그를 확인할 수 있습니다.
이미지 서명을 확인하려면 다음 형식을 사용합니다.
$ oc adm verify-image-signature <image> --expected-identity=<pull_spec> [--save] [options]
<pull_spec>
은 이미지 스트림을 설명하여 찾을 수 있습니다. 이미지 스트림 태그를 설명하여 <image>
를 찾을 수 있습니다. 다음 예제 명령 출력을 참조하십시오.
이미지 서명 확인 예
$ oc describe is nodejs -n openshift Name: nodejs Namespace: openshift Created: 2 weeks ago Labels: <none> Annotations: openshift.io/display-name=Node.js openshift.io/image.dockerRepositoryCheck=2017-07-05T18:24:01Z Docker Pull Spec: 172.30.1.1:5000/openshift/nodejs ... $ oc describe istag nodejs:latest -n openshift Image Name: sha256:2bba968aedb7dd2aafe5fa8c7453f5ac36a0b9639f1bf5b03f95de325238b288 ... $ oc adm verify-image-signature \ sha256:2bba968aedb7dd2aafe5fa8c7453f5ac36a0b9639f1bf5b03f95de325238b288 \ --expected-identity 172.30.1.1:5000/openshift/nodejs:latest \ --public-key /etc/pki/rpm-gpg/RPM-GPG-KEY-redhat-release \ --save
oc adm verify-image-signature
명령에서 알 수 없는 기관 오류로 서명된 x509: certificate signed
를 반환하는 경우 시스템에서 신뢰할 수 있는 CA 목록에 레지스트리의 CA(인증 기관)를 추가해야 할 수 있습니다. 다음 단계를 수행하여 이 작업을 수행할 수 있습니다.
클러스터에서 클라이언트 시스템으로 CA 인증서를 전송합니다.
예를 들어 docker-registry.default.svc 의 CA를 추가하려면 /etc/docker/certs.d/docker-registry.default.svc\:5000/node-client-ca.crt 에 있는 파일을 전송합니다.
CA 인증서를 /etc/pki/ca-trust/source/anchors/ 디렉터리에 복사합니다. 예를 들면 다음과 같습니다.
# cp </path_to_file>/node-client-ca.crt \ /etc/pki/ca-trust/source/anchors/
update-ca-trust
를 실행하여 신뢰할 수 있는 CA 목록을 업데이트합니다.# update-ca-trust
12.4. 레지스트리 API를 사용하여 이미지 서명에 액세스
OpenShift Container Registry에서는 이미지 서명을 작성하고 읽을 수 있는 확장
끝점을 제공합니다. 이미지 서명은 컨테이너 이미지 레지스트리 API를 통해 OpenShift Container Platform 키-값 저장소에 저장됩니다.
이 엔드포인트는 실험적이며 업스트림 컨테이너 이미지 레지스트리 프로젝트에서 지원하지 않습니다. 컨테이너 이미지 레지스트리 API에 대한 일반 정보는 업스트림 API 문서를 참조하십시오.
12.4.1. API를 통한 이미지 서명 작성
이미지에 새 서명을 추가하려면 HTTP PUT
메서드를 사용하여 JSON 페이로드를 확장
끝점으로 보낼 수 있습니다.
PUT /extensions/v2/<namespace>/<name>/signatures/<digest>
$ curl -X PUT --data @signature.json http://<user>:<token>@<registry_endpoint>:5000/extensions/v2/<namespace>/<name>/signatures/sha256:<digest>
서명 콘텐츠가 있는 JSON 페이로드에는 다음과 같은 구조가 있어야 합니다.
{ "version": 2, "type": "atomic", "name": "sha256:4028782c08eae4a8c9a28bf661c0a8d1c2fc8e19dbaae2b018b21011197e1484@cddeb7006d914716e2728000746a0b23", "content": "<cryptographic_signature>" }
name
필드에는 고유해야 하며 <digest>@<name>
형식의 이미지 서명 이름이 포함되어 있습니다. <digest>
는 이미지 이름을 나타내고 <name>
은 서명의 이름입니다. 서명 이름은 32자여야 합니다. <cryptographic_signature>
는 컨테이너/이미지 라이브러리에 설명된 사양을 따라야 합니다.
12.4.2. API를 통해 이미지 서명 읽기
서명된 이미지가 OpenShift Container Registry에 이미 푸시되었다고 가정하면 다음 명령을 사용하여 서명을 읽을 수 있습니다.
GET /extensions/v2/<namespace>/<name>/signatures/<digest>
$ curl http://<user>:<token>@<registry_endpoint>:5000/extensions/v2/<namespace>/<name>/signatures/sha256:<digest>
<namespace>
는 OpenShift Container Platform 프로젝트 이름 또는 레지스트리 리포지토리 이름을 나타내고 <name>
은 이미지 리포지토리의 이름을 나타냅니다. 다이제스트
는 이미지의 SHA-256 체크섬을 나타냅니다.
지정된 이미지에 서명 데이터가 포함된 경우 위의 명령 출력에서 다음 JSON 응답을 생성해야 합니다.
{ "signatures": [ { "version": 2, "type": "atomic", "name": "sha256:4028782c08eae4a8c9a28bf661c0a8d1c2fc8e19dbaae2b018b21011197e1484@cddeb7006d914716e2728000746a0b23", "content": "<cryptographic_signature>" } ] }
name
필드에는 고유해야 하며 <digest>@<name>
형식의 이미지 서명 이름이 포함되어 있습니다. <digest>
는 이미지 이름을 나타내고 <name>
은 서명의 이름입니다. 서명 이름은 32자여야 합니다. <cryptographic_signature>
는 컨테이너/이미지 라이브러리에 설명된 사양을 따라야 합니다.
12.4.3. 서명 저장소에서 자동으로 이미지 서명 가져오기
레지스트리 구성 디렉터리를 통해 모든 OpenShift Container Platform 마스터 노드에 서명 저장소가 구성된 경우 OpenShift Container Platform은 이미지 서명을 자동으로 가져올 수 있습니다.
레지스트리 구성 디렉터리에는 다양한 레지스트리(원격 컨테이너 이미지를 저장하는 서버)와 여기에 저장된 콘텐츠에 대한 구성이 포함되어 있습니다. 단일 디렉터리를 사용하면 container/image의 모든 사용자가 공유할 수 있도록 각 명령의 명령줄 옵션으로 구성을 제공할 필요가 없습니다.
기본 레지스트리 구성 디렉터리는 /etc/containers/registries.d/default.yaml 파일에 있습니다.
모든 Red Hat 이미지에 대해 이미지 서명을 자동으로 가져오는 샘플 구성:
docker:
registry.redhat.io:
sigstore: https://registry.redhat.io/containers/sigstore 1
- 1
- 서명 저장소의 URL을 정의합니다. 이 URL은 기존 서명을 읽는 데 사용됩니다.
OpenShift Container Platform에서 자동으로 가져온 서명은 기본적으로 확인되지 않으며 이미지 관리자가 확인해야 합니다.
레지스트리 구성 디렉터리에 대한 자세한 내용은 레지스트리 구성 디렉터리를 참조하십시오.
13장. 범위가 지정된 토큰
13.1. 개요
사용자는 다른 엔터티에 이와 같은 기능을 수행하는 권한을 부여할 수 있지만 제한된 방식으로만 부여할 수 있습니다. 예를 들어 프로젝트 관리자가 포드 생성 권한을 위임할 수 있습니다. 이렇게 하는 한 가지 방법은 범위가 지정된 토큰을 생성하는 것입니다.
범위가 지정된 토큰은 지정된 사용자로 식별되지만 범위별로 특정 작업으로 제한되는 토큰입니다. 현재 cluster-admin 만 범위가 지정된 토큰을 생성할 수 있습니다.
13.2. 평가
범위는 토큰의 범위 집합을 PolicyRules 집합으로 변환하여 평가합니다. 그러면 요청이 해당 규칙과 대조됩니다. 추가적인 권한 확인을 위해 "일반"권한 부여자에게 전달하려면 요청 속성이 하나 이상의 범위 규칙과 일치해야 합니다.
13.3. 사용자 범위
사용자 범위는 지정된 사용자에 대한 정보를 얻는 데 중점을 둡니다. 의도 기반이므로 다음과 같이 규칙이 자동으로 생성됩니다.
-
user:full
- 모든 사용자 권한에 API에 대한 전체 읽기/쓰기 액세스를 허용합니다. -
user:info
- 사용자 정보(이름, 그룹 등)에 대한 읽기 전용 액세스를 허용합니다. -
user:check-access
- self-localsubjectaccessreviews 및 self-subjectaccessreviews에 대한 액세스를 허용합니다. 해당 항목은 요청 오브젝트에서 빈 사용자 및 그룹을 전달하는 변수입니다. -
user:list-projects
- 사용자가 액세스할 수 있는 프로젝트를 나열하도록 읽기 전용 액세스를 허용합니다.
13.4. 역할 범위
역할 범위를 사용하면 네임스페이스로 필터링되어 지정된 역할과 동일한 수준의 액세스 권한을 가질 수 있습니다.
role:<cluster-role name>:<namespace or * for all>
- 클러스터 역할에 따라 지정된 규칙으로 범위가 제한되지만, 지정된 네임스페이스에 한합니다.참고경고 사항: 이렇게 하면 액세스 권한이 에스컬레이션되지 않습니다. 시크릿, 역할 바인딩 및 역할과 같은 리소스에 액세스할 수 있는 역할이더라도 이 범위는 해당 리소스에 대한 액세스를 거부합니다. 따라서 예기치 않은 에스컬레이션을 방지할 수 있습니다. 대부분의 사람들은 edit와 같은 역할을 에스컬레이션되는 역할로 생각하지 않지만 시크릿에 액세스할 수 있는 경우 에스컬레이션됩니다.
-
role:<cluster-role name>:<namespace or * for all>:!
- 느낌표를 넣어 이 범위에서 액세스 권한을 에스컬레이션할 수 있다는 점을 제외하면 위의 예와 유사합니다.
14장. 이미지 모니터링
14.1. 개요
14.2. 이미지 통계 보기
OpenShift Container Platform에서 관리하는 모든 이미지에 대한 사용량 통계를 표시할 수 있습니다. 즉, 모든 이미지는 직접 또는 빌드를 통해 내부 레지스트리에 푸시됩니다.
사용량 통계를 보려면 다음을 수행합니다.
$ oc adm top images NAME IMAGESTREAMTAG PARENTS USAGE METADATA STORAGE sha256:80c985739a78b openshift/python (3.5) yes 303.12MiB sha256:64461b5111fc7 openshift/ruby (2.2) yes 234.33MiB sha256:0e19a0290ddc1 test/ruby-ex (latest) sha256:64461b5111fc71ec Deployment: ruby-ex-1/test yes 150.65MiB sha256:a968c61adad58 test/django-ex (latest) sha256:80c985739a78b760 Deployment: django-ex-1/test yes 186.07MiB
명령은 다음 정보를 표시합니다.
- 이미지 ID
-
포함된
ImageStreamTag
의 프로젝트, 이름 및 태그 - ID로 나열된 이미지의 잠재적 부모
- 이미지가 사용되는 위치에 대한 정보
- 이미지에 적절한 Docker 메타데이터 정보가 포함되어 있는지 여부를 알리는 플래그
- 이미지 크기
14.3. 이미지 스트림 통계 보기
이미지 스트림에 대한 사용량 통계를 표시할 수 있습니다
.
사용량 통계를 보려면 다음을 수행합니다.
$ oc adm top imagestreams NAME STORAGE IMAGES LAYERS openshift/python 1.21GiB 4 36 openshift/ruby 717.76MiB 3 27 test/ruby-ex 150.65MiB 1 10 test/django-ex 186.07MiB 1 10
명령은 다음 정보를 표시합니다.
-
ImageStream
의 프로젝트 및 이름 -
내부 Red Hat Container Registry에 저장된 전체
이미지 스트림
의 크기 -
이 특정 이미지 스트림이 가리키는
이미지
수 -
레이어 수
ImageStream
은 다음으로 구성됩니다.
14.4. 이미지 정리
이전 명령에서 반환된 정보는 이미지 정리를 수행할 때 유용합니다.
15장. 보안 컨텍스트 제약 조건 관리
15.1. 개요
보안 컨텍스트 제약 조건을 통해 관리자는 포드에 대한 권한을 제어할 수 있습니다. 이 API 유형에 대한 자세한 내용은 SCC( 보안 컨텍스트 제약 조건 ) 아키텍처 설명서를 참조하십시오. CLI를 사용하여 인스턴스의 SCC를 일반 API 오브젝트로 관리할 수 있습니다.
SCC를 관리하려면 cluster-admin 권한이 있어야 합니다.
기본 SCC를 수정하지 마십시오. 기본 SCC를 사용자 정의하면 업그레이드 시 문제가 발생할 수 있습니다. 대신 새 SCC를 만듭니다.
15.2. 보안 컨텍스트 제약 조건 나열
현재 SCC 목록을 가져오려면 다음을 실행합니다.
$ oc get scc NAME PRIV CAPS SELINUX RUNASUSER FSGROUP SUPGROUP PRIORITY READONLYROOTFS VOLUMES anyuid false [] MustRunAs RunAsAny RunAsAny RunAsAny 10 false [configMap downwardAPI emptyDir persistentVolumeClaim secret] hostaccess false [] MustRunAs MustRunAsRange MustRunAs RunAsAny <none> false [configMap downwardAPI emptyDir hostPath persistentVolumeClaim secret] hostmount-anyuid false [] MustRunAs RunAsAny RunAsAny RunAsAny <none> false [configMap downwardAPI emptyDir hostPath nfs persistentVolumeClaim secret] hostnetwork false [] MustRunAs MustRunAsRange MustRunAs MustRunAs <none> false [configMap downwardAPI emptyDir persistentVolumeClaim secret] nonroot false [] MustRunAs MustRunAsNonRoot RunAsAny RunAsAny <none> false [configMap downwardAPI emptyDir persistentVolumeClaim secret] privileged true [*] RunAsAny RunAsAny RunAsAny RunAsAny <none> false [*] restricted false [] MustRunAs MustRunAsRange MustRunAs RunAsAny <none> false [configMap downwardAPI emptyDir persistentVolumeClaim secret]
15.3. 보안 컨텍스트 제약 조건 검사 오브젝트
SCC가 적용되는 사용자, 서비스 계정 및 그룹을 포함하여 특정 SCC에 대한 정보를 볼 수 있습니다.
예를 들어 restricted SCC를 검사하려면 다음을 실행합니다.
$ oc describe scc restricted Name: restricted Priority: <none> Access: Users: <none> 1 Groups: system:authenticated 2 Settings: Allow Privileged: false Default Add Capabilities: <none> Required Drop Capabilities: KILL,MKNOD,SYS_CHROOT,SETUID,SETGID Allowed Capabilities: <none> Allowed Seccomp Profiles: <none> Allowed Volume Types: configMap,downwardAPI,emptyDir,persistentVolumeClaim,projected,secret Allow Host Network: false Allow Host Ports: false Allow Host PID: false Allow Host IPC: false Read Only Root Filesystem: false Run As User Strategy: MustRunAsRange UID: <none> UID Range Min: <none> UID Range Max: <none> SELinux Context Strategy: MustRunAs User: <none> Role: <none> Type: <none> Level: <none> FSGroup Strategy: MustRunAs Ranges: <none> Supplemental Groups Strategy: RunAsAny Ranges: <none>
업그레이드 중에 사용자 지정 SCC를 유지하려면 우선 순위, 사용자, 그룹, 레이블 및 주석 이외의 기본 SCC에서 설정을 편집하지 마십시오.
15.4. 새 보안 컨텍스트 제약 조건 생성
새 SCC를 생성하려면 다음을 수행합니다.
JSON 또는 YAML 파일에 SCC를 정의합니다.
보안 컨텍스트 제한 조건 오브젝트 정의
kind: SecurityContextConstraints apiVersion: v1 metadata: name: scc-admin allowPrivilegedContainer: true runAsUser: type: RunAsAny seLinuxContext: type: RunAsAny fsGroup: type: RunAsAny supplementalGroups: type: RunAsAny users: - my-admin-user groups: - my-admin-group
필요한 경우
requiredDropCapabilities
필드를 원하는 값으로 설정하여 SCC에 드롭 기능을 추가할 수 있습니다. 지정된 기능은 컨테이너에서 삭제됩니다. 예를 들어KILL
,MKNOD
및SYS_CHROOT
필수 삭제 기능을 사용하여 SCC를 생성하려면 SCC 오브젝트에 다음을 추가합니다.requiredDropCapabilities: - KILL - MKNOD - SYS_CHROOT
Docker 설명서에서 사용 가능한 값 목록을 확인할 수 있습니다.
작은 정보기능이 Docker로 전달되므로 특수한
ALL
값을 사용하여 가능한 모든 기능을 삭제할 수 있습니다.그런 다음
oc create
를 실행하고 파일을 전달하여 파일을 생성합니다.$ oc create -f scc_admin.yaml securitycontextconstraints "scc-admin" created
SCC가 생성되었는지 확인합니다.
$ oc get scc scc-admin NAME PRIV CAPS SELINUX RUNASUSER FSGROUP SUPGROUP PRIORITY READONLYROOTFS VOLUMES scc-admin true [] RunAsAny RunAsAny RunAsAny RunAsAny <none> false [awsElasticBlockStore azureDisk azureFile cephFS cinder configMap downwardAPI emptyDir fc flexVolume flocker gcePersistentDisk glusterfs iscsi nfs persistentVolumeClaim photonPersistentDisk quobyte rbd secret vsphere]
15.5. 보안 컨텍스트 제약 조건 삭제
SCC를 삭제하려면 다음을 수행합니다.
$ oc delete scc <scc_name>
기본 SCC를 삭제하면 재시작 시 다시 생성됩니다.
15.6. 보안 컨텍스트 제약 조건 업데이트
기존 SCC를 업데이트하려면 다음을 수행합니다.
$ oc edit scc <scc_name>
업그레이드 중에 사용자 지정 SCC를 유지하려면 우선 순위, 사용자 및 그룹 이외의 기본 SCC에 대한 설정을 편집하지 마십시오.
15.6.1. 보안 컨텍스트 제약 조건 설정 예
명시적인 runAsUser 설정 없이
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo
spec:
securityContext: 1
containers:
- name: sec-ctx-demo
image: gcr.io/google-samples/node-hello:1.0
- 1
- 컨테이너 또는 pod에서 실행해야 하는 사용자 ID를 요청하지 않는 경우, 유효 UID는 이 pod를 내보내는 SCC에 따라 다릅니다. 제한된 SCC는 기본적으로 인증된 모든 사용자에게 부여되므로 모든 사용자 및 서비스 계정에서 사용할 수 있으며, 대부분의 사례에서 사용됩니다. 제한된 SCC는
securityContext.runAsUser
필드의 사용 가능한 값을 제한하고 기본값을 설정하는 데MustRunAsRange
전략을 사용합니다. 허용 플러그인에서는 이 범위를 제공하지 않기 때문에 현재 프로젝트에서openshift.io/sa.scc.uid-range
주석을 찾아 범위 필드를 채웁니다. 결국 컨테이너에는 모든 프로젝트의 범위가 다르기 때문에 예측하기 어려운 범위의 첫 번째 값과 동일한runAsUser
가 있게 됩니다. 자세한 내용은 사전 할당된 값 및 보안 컨텍스트 제약 조건 이해를 참조하십시오.
명시적인 runAsUser 설정
apiVersion: v1
kind: Pod
metadata:
name: security-context-demo
spec:
securityContext:
runAsUser: 1000 1
containers:
- name: sec-ctx-demo
image: gcr.io/google-samples/node-hello:1.0
- 1
- 특정 사용자 ID를 요청하는 컨테이너 또는 Pod는 서비스 계정 또는 사용자에게 해당 사용자 ID를 허용하는 SCC에 대한 액세스 권한이 부여된 경우에만 OpenShift Container Platform에서 승인됩니다. SCC를 사용하면 임의의 ID, 특정 범위에 속하는 ID 또는 요청과 관련된 정확한 사용자 ID를 허용할 수 있습니다.
이는 SELinux, fsGroup 및 Supplemental Groups에서 작동합니다. 자세한 내용은 볼륨 보안을 참조하십시오.
15.7. 기본 보안 컨텍스트 제약 조건 업데이트
마스터가 누락된 경우 마스터가 시작될 때 기본 SCC가 생성됩니다. SCC를 기본값으로 재설정하거나 업그레이드 후 기존 SCC를 새 기본 정의로 업데이트하려면 다음을 수행할 수 있습니다.
- 재설정할 SCC를 삭제하고 마스터를 다시 시작하여 다시 생성되도록 합니다.
-
oc adm policy reconcile-sccs
명령을 사용합니다.
oc adm policy reconcile-sccs
명령은 모든 SCC 정책을 기본값으로 설정하지만 추가 사용자, 그룹, 라벨 및 주석을 이미 설정한 우선순위는 유지합니다. 변경되는 SCC를 보려면 옵션 없이 명령을 실행하거나 -o <format>
옵션으로 선호하는 출력을 지정할 수 있습니다.
기존 SCC를 백업한 다음 --confirm
옵션을 사용하여 데이터를 유지하는 것이 좋습니다.
우선순위 및 부여를 재설정하려면 --additive-only=false
옵션을 사용합니다.
SCC에서 우선 순위, 사용자, 그룹, 레이블 또는 주석을 제외한 사용자 지정 설정이 있는 경우 조정 시 해당 설정이 손실됩니다.
15.8. 어떻게 해야 합니까?
다음은 SCC를 사용하는 일반적인 시나리오 및 절차를 설명합니다.
15.8.1. Privileged SCC에 대한 액세스 권한 부여
관리자가 관리자 그룹 외부의 사용자 또는 그룹이 액세스 권한을 갖는 사용자 또는 그룹을 허용하도록 허용해야 하는 경우도 있습니다. 이를 위해 다음을 수행할 수 있습니다.
SCC에 액세스할 사용자 또는 그룹을 확인합니다.
주의사용자에게 직접 포드를 생성할 때만 사용자에게 액세스 권한을 부여하는 것은 작동합니다. 사용자를 대신하여 생성된 포드의 경우 대부분의 경우 시스템 자체에서 관련 컨트롤러가 작동하는 서비스 계정에 액세스 권한을 부여해야 합니다. 사용자를 대신하여 포드를 생성하는 리소스의 예로는 Deployments, StatefulSets, DaemonSets 등이 있습니다.
다음을 실행합니다.
$ oc adm policy add-scc-to-user <scc_name> <user_name> $ oc adm policy add-scc-to-group <scc_name> <group_name>
예를 들어 e2e-user 가 권한 있는 SCC에 액세스할 수 있도록 하려면 다음을 실행합니다.
$ oc adm policy add-scc-to-user privileged e2e-user
-
권한 있는 모드를 요청하도록 컨테이너의
SecurityContext
를 수정합니다.
15.8.2. Privileged SCC에 대한 서비스 계정 액세스 권한 부여
먼저 서비스 계정을 만듭니다. 예를 들어 my project
프로젝트에서 서비스 계정 mysvcacct
를 생성하려면 다음을 수행합니다.
$ oc create serviceaccount mysvcacct -n myproject
그런 다음 권한 있는
SCC에 서비스 계정을 추가합니다.
$ oc adm policy add-scc-to-user privileged system:serviceaccount:myproject:mysvcacct
그런 다음 서비스 계정을 대신하여 리소스가 생성되고 있는지 확인합니다. 이를 위해 spec.serviceAccountName
필드를 서비스 계정 이름으로 설정합니다. 서비스 계정 이름을 비워 두면 기본
서비스 계정이 사용됩니다.
그런 다음 Pod의 컨테이너 중 하나 이상이 보안 컨텍스트에서 권한 있는 모드를 요청하는지 확인합니다.
15.8.3. Dockerfile에서 USER를 사용하여 이미지 활성화
이미지가 권한 있는 SCC에 대한 액세스 권한을 부여하지 않고 사전 할당된 UID로 실행하도록 클러스터의 보안을 완화하려면 다음을 수행합니다.
인증된 모든 사용자에게 anyuid SCC에 대한 액세스 권한을 부여합니다.
$ oc adm policy add-scc-to-group anyuid system:authenticated
이를 통해 Dockerfile 에 USER 가 지정되지 않은 경우 이미지를 루트 UID로 실행할 수 있습니다.
15.8.4. 루트가 필요한 컨테이너 이미지 활성화
일부 컨테이너 이미지(예: postgres
및 redis
)에는 루트 액세스 권한이 필요하며 볼륨이 소유되는 방법에 대한 특정 기대치가 있습니다. 이러한 이미지의 경우 anyuid
SCC에 서비스 계정을 추가합니다.
$ oc adm policy add-scc-to-user anyuid system:serviceaccount:myproject:mysvcacct
15.8.5. 레지스트리에 --mount-host 사용
레지스트리 배포에 PersistentVolume
및 PersistentVolumeClaim
오브젝트를 사용하는 영구 스토리지를 사용하는 것이 좋습니다. 테스트 중이며 oc adm registry
명령을 --mount-host
옵션과 함께 사용하려면 먼저 레지스트리에 대한 새 서비스 계정을 생성하여 권한 있는 SCC에 추가해야 합니다. 전체 지침은 관리자 가이드를 참조하십시오.
15.8.6. 추가 기능 제공
경우에 따라 이미지에 Docker에서 기본적으로 제공하지 않는 기능이 필요할 수 있습니다. SCC에 대해 검증할 Pod 사양에서 추가 기능을 요청하는 기능을 제공할 수 있습니다.
이렇게 하면 이미지를 상승된 기능으로 실행할 수 있으며 필요한 경우에만 사용해야 합니다. 추가 기능을 활성화하려면 기본 제한된 SCC를 편집해서는 안 됩니다.
루트가 아닌 사용자와 함께 사용하는 경우 추가 기능이 필요한 파일에 setcap
명령을 사용하여 기능이 부여되었는지 확인해야 합니다. 예를 들어 이미지의 Dockerfile 에서 다음을 수행합니다.
setcap cap_net_raw,cap_net_admin+p /usr/bin/ping
또한 Docker에서 기본적으로 기능을 제공하는 경우 pod 사양을 수정하여 요청할 필요가 없습니다. 예를 들어 NET_RAW
는 기본적으로 제공되며 기능은 ping에 이미 설정되어 있어야 하므로 ping
을 실행하는 데 특별한 단계가 필요하지 않습니다 .
추가 기능을 제공하려면 다음을 수행합니다.
- 새 SCC 만들기
-
allowed
Capabilities 필드를 사용하여 허용된
기능을 추가합니다. -
Pod를 생성할 때
securityContext.capabilities.add
필드의 기능을 요청합니다.
15.8.7. 클러스터 기본 동작 수정
모든 사용자에 대해 anyuid SCC에 대한 액세스 권한을 부여하면 클러스터에 클러스터가 부여됩니다.
- UID를 사전 할당하지 않음
- 컨테이너가 모든 사용자로 실행되도록 허용
- 권한 있는 컨테이너 방지
$ oc adm policy add-scc-to-group anyuid system:authenticated
UID를 사전 할당하지 않고 컨테이너를 root로 실행할 수 없도록 클러스터를 수정하려면 모든 사용자에 대해 루트가 아닌 SCC 에 대한 액세스 권한을 부여합니다.
$ oc adm policy add-scc-to-group nonroot system:authenticated
클러스터 전체에 영향을 미치는 수정 사항에 매우 주의하십시오. 이전 예제와 같이 인증된 모든 사용자에게 SCC를 부여하거나, 제한된 SCC와 같은 모든 사용자에게 적용되는 SCC를 수정하면 웹 콘솔 및 통합 컨테이너 이미지 레지스트리를 포함하여 Kubernetes 및 OpenShift Container Platform 구성 요소에도 영향을 미칩니다. 이러한 SCC의 변경으로 인해 이러한 구성 요소가 작동하지 않을 수 있습니다.
대신 사용자 지정 SCC를 만들고 특정 사용자 또는 그룹에만 대상으로 지정합니다. 이러한 방식으로 잠재적인 문제는 영향을 받는 사용자 또는 그룹에 제한되며 중요한 클러스터 구성 요소에 영향을 주지 않습니다.
15.8.8. hostPath 볼륨 플러그인 사용
Pod에서 privileged, host access 또는 hostmount-anyuid 와 같은 권한 있는 SCC에 대한 액세스 권한을 부여하지 않고 Pod에서 hostPath
볼륨 플러그인을 사용할 수 있도록 클러스터의 보안을 완화하려면 다음 작업을 수행합니다.
-
hostpath
라는 새 SCC 만들기 새 SCC에
allowHostDirVolumePlugin
매개변수를true
로 설정합니다.$ oc patch scc hostpath -p '{"allowHostDirVolumePlugin": true}'
모든 사용자에게 이 SCC에 대한 액세스 권한을 부여합니다.
$ oc adm policy add-scc-to-group hostpath system:authenticated
이제 hostPath
볼륨을 요청하는 모든 Pod가 hostpath
SCC에서 허용합니다.
15.8.9. 특정 SCC를 먼저 사용하도록 승인했는지 확인하십시오.
SCC의 Priority
필드를 설정하여 허용 중인 SCC 정렬 순서를 제어할 수 있습니다. 정렬에 대한 자세한 내용은 SCC 우선순위 섹션을 참조하십시오.
15.8.10. 사용자, 그룹 또는 프로젝트에 SCC 추가
SCC를 사용자 또는 그룹에 추가하기 전에 먼저 scc-review
옵션을 사용하여 사용자 또는 그룹이 포드를 만들 수 있는지 확인할 수 있습니다. 자세한 내용은 권한 부여 주제를 참조하십시오.
SCC는 프로젝트에 직접 부여되지 않습니다. 대신 SCC에 서비스 계정을 추가하고 포드에서 서비스 계정 이름을 지정하거나 지정되지 않은 경우 default
서비스 계정으로 실행합니다.
사용자에게 SCC를 추가하려면 다음을 수행합니다.
$ oc adm policy add-scc-to-user <scc_name> <user_name>
서비스 계정에 SCC를 추가하려면 다음을 수행합니다.
$ oc adm policy add-scc-to-user <scc_name> \ system:serviceaccount:<serviceaccount_namespace>:<serviceaccount_name>
현재 서비스 계정이 속하는 프로젝트에 있는 경우 -z
플래그를 사용하고 <serviceaccount_name>
만 지정할 수 있습니다.
$ oc adm policy add-scc-to-user <scc_name> -z <serviceaccount_name>
위에 설명된 대로 -z
플래그를 사용하는 것이 좋습니다. 이는 오타를 방지하고 지정된 서비스 계정에만 액세스 권한을 부여하는 데 도움이 되기 때문입니다. 프로젝트에 없는 경우 -n
옵션을 사용하여 적용되는 프로젝트 네임스페이스를 표시합니다.
그룹에 SCC를 추가하려면 다음을 수행합니다.
$ oc adm policy add-scc-to-group <scc_name> <group_name>
네임스페이스의 모든 서비스 계정에 SCC를 추가하려면 다음을 수행합니다.
$ oc adm policy add-scc-to-group <scc_name> \ system:serviceaccounts:<serviceaccount_namespace>
16장. 예약
16.1. 개요
16.1.1. 개요
Pod 예약은 클러스터 내 노드에 대한 새 Pod 배치를 결정하는 내부 프로세스입니다.
스케줄러 코드는 새 Pod가 생성될 때 해당 Pod를 감시하고 이를 호스팅하는 데 가장 적합한 노드를 확인할 수 있도록 깔끔하게 분리되어 있습니다. 그런 다음 마스터 API를 사용하여 Pod에 대한 바인딩(Pod와 노드의 바인딩)을 생성합니다.
16.1.2. 기본 예약
OpenShift Container Platform에는 대부분의 사용자의 요구 사항을 충족하는 기본 스케줄러가 제공됩니다. 기본 스케줄러는 고유 툴과 사용자 지정 가능한 툴을 모두 사용하여 Pod에 가장 적합한 도구를 결정합니다.
기본 스케줄러에서 Pod 배치 및 사용 가능한 사용자 정의 매개 변수를 결정하는 방법에 대한 자세한 내용은 기본 예약을 참조하십시오.
16.1.3. 고급 예약
새 Pod가 배치되는 위치를 추가로 제어해야 하는 경우 OpenShift Container Platform 고급 예약 기능을 사용하면 특정 노드 또는 특정 Pod와 함께 Pod를 시작(또는 기본 설정)하도록 Pod를 구성할 수 있습니다. 또한 고급 예약을 통해 Pod가 노드 또는 다른 Pod에 배치되지 않도록 할 수 있습니다.
고급 스케줄링에 대한 자세한 내용은 Advanced Scheduling 을 참조하십시오.
16.1.4. 사용자 정의 예약
OpenShift Container Platform을 사용하면 Pod 사양을 편집하여 자체 또는 타사 스케줄러를 사용할 수도 있습니다.
자세한 내용은 Custom Scheduler를 참조하십시오.
16.2. 기본 예약
16.2.1. 개요
기본 OpenShift Container Platform Pod 스케줄러는 클러스터 내의 노드에 대한 새 Pod 배치를 결정합니다. Pod에서 데이터를 읽고 구성된 정책에 따라 적합한 노드를 찾으려고 합니다. 이 스케줄러는 완전히 독립적이며 독립형/플러그형 솔루션으로 존재합니다. Pod를 수정하지 않고 Pod를 특정 노드에 연결하는 Pod 바인딩만 생성합니다.
16.2.2. 일반 스케줄러
기존 일반 스케줄러는 3단계 작업에서 Pod를 호스팅할 노드를 선택하는 기본 플랫폼 제공 스케줄러 엔진에 해당합니다.
- 스케줄러는 서술자를 사용하여 부적절한 노드를 필터링합니다.
- 스케줄러는 필터링된 노드 목록의 우선 순위를 지정합니다.
- 스케줄러는 Pod 의 우선 순위가 가장 높은 노드를 선택합니다.
16.2.3. 노드 필터링
사용 가능한 노드를 지정된 제약 조건 또는 요구 사항에 따라 필터링합니다. 이 작업은 서술자 라는 필터 함수 목록을 통해 각 노드를 실행하여 수행됩니다.
16.2.3.1. 필터링된 노드 목록 우선순위 지정
이는 0~10 사이의 점수를 할당하는 일련의 우선 순위 함수를 통해 각 노드를 전달하여 달성되며 0은 포드를 호스트하는 데 적합하지 않음을 나타내고 10은 적합함을 나타냅니다. 스케줄러 구성은 각 우선순위 함수에 간단한 가중치(양의 숫자 값)를 사용할 수도 있습니다. 각 우선순위 함수에서 제공하는 노드 점수에 가중치(대부분의 우선순위에 대한 기본 가중치는 1임)를 곱한 다음 모든 우선순위에서 제공하는 각 노드의 점수를 더하여 결합합니다. 관리자는 이러한 가중치 특성을 사용하여 일부 우선순위에 높은 중요성을 부여할 수 있습니다.
16.2.3.2. 최적의 노드 선택
노드는 해당 점수에 따라 정렬되며 점수가 가장 높은 노드가 Pod를 호스팅하도록 선택됩니다. 여러 노드의 점수가 동일한 경우 해당 노드 중 하나가 무작위로 선택됩니다.
16.2.4. 스케줄러 정책
서술자 및 우선순위 를 선택하면 스케줄러에 대한 정책이 정의됩니다.
스케줄러 구성 파일은 스케줄러에서 고려할 서술자 및 우선순위를 지정하는 JSON 파일입니다.
스케줄러 정책 파일이 없으면 기본 구성 파일 /etc/origin/master/scheduler.json 이 적용됩니다.
스케줄러 구성 파일에 정의된 서술자 및 우선순위는 기본 스케줄러 정책을 완전히 덮어씁니다. 기본 서술자 및 우선순위 중 하나라도 필요한 경우 스케줄러 구성 파일에서 함수를 명시적으로 지정해야 합니다.
기본 스케줄러 구성 파일
{ "apiVersion": "v1", "kind": "Policy", "predicates": [ { "name": "NoVolumeZoneConflict" }, { "name": "MaxEBSVolumeCount" }, { "name": "MaxGCEPDVolumeCount" }, { "name": "MaxAzureDiskVolumeCount" }, { "name": "MatchInterPodAffinity" }, { "name": "NoDiskConflict" }, { "name": "GeneralPredicates" }, { "name": "PodToleratesNodeTaints" }, { "argument": { "serviceAffinity": { "labels": [ "region" ] } }, "name": "Region" } ], "priorities": [ { "name": "SelectorSpreadPriority", "weight": 1 }, { "name": "InterPodAffinityPriority", "weight": 1 }, { "name": "LeastRequestedPriority", "weight": 1 }, { "name": "BalancedResourceAllocation", "weight": 1 }, { "name": "NodePreferAvoidPodsPriority", "weight": 10000 }, { "name": "NodeAffinityPriority", "weight": 1 }, { "name": "TaintTolerationPriority", "weight": 1 }, { "argument": { "serviceAntiAffinity": { "label": "zone" } }, "name": "Zone", "weight": 2 } ] }
16.2.4.1. 스케줄러 정책 수정
스케줄러 정책은 마스터 구성 파일의 kubernetesMasterConfig .schedulerConfigFile 필드에서 재정의하지 않는 한 기본적으로 /etc/origin/master/scheduler.json
이라는 마스터의 파일에 정의되어 있습니다.
수정된 스케줄러 구성 파일 샘플
kind: "Policy" version: "v1" "predicates": [ { "name": "PodFitsResources" }, { "name": "NoDiskConflict" }, { "name": "MatchNodeSelector" }, { "name": "HostName" }, { "argument": { "serviceAffinity": { "labels": [ "region" ] } }, "name": "Region" } ], "priorities": [ { "name": "LeastRequestedPriority", "weight": 1 }, { "name": "BalancedResourceAllocation", "weight": 1 }, { "name": "ServiceSpreadingPriority", "weight": 1 }, { "argument": { "serviceAntiAffinity": { "label": "zone" } }, "name": "Zone", "weight": 2 } ]
스케줄러 정책을 수정하려면 다음을 수행합니다.
- 스케줄러 구성 파일을 편집하여 원하는 기본 서술자 및 우선순위를 구성합니다. 사용자 지정 구성을 생성하거나 샘플 정책 구성 중 하나를 사용하고 수정할 수 있습니다.
- 필요한 구성 가능 서술자 및 구성 가능 우선순위 를 추가합니다.
변경 사항을 적용하려면 OpenShift Container Platform을 다시 시작하십시오.
# master-restart api # master-restart controllers
16.2.5. 사용 가능한 서술자
서술자는 정규화되지 않은 노드를 필터링하는 규칙입니다.
OpenShift Container Platform에는 기본적으로 제공되는 몇 가지 서술자가 있습니다. 이러한 서술자 중 일부는 특정 매개변수를 제공하여 사용자 정의할 수 있습니다. 여러 개의 서술자를 결합하여 노드 필터링을 추가로 제공할 수도 있습니다.
16.2.5.1. 정적 서술자
이러한 서술자에는 구성 매개변수 또는 사용자 입력이 사용되지 않습니다. 대신 정확한 이름을 사용하여 스케줄러 구성에 지정됩니다.
16.2.5.1.1. 기본 서술자
기본 스케줄러 정책에는 다음과 같은 서술자가 포함됩니다.
NoVolumeZoneConflict 는 Pod에서 요청하는 볼륨을 영역에서 사용할 수 있는지 확인합니다.
{"name" : "NoVolumeZoneConflict"}
MaxEBSVolumeCount 는 AWS 인스턴스에 연결할 수 있는 최대 볼륨 수를 확인합니다.
{"name" : "MaxEBSVolumeCount"}
MaxGCEPDVolumeCount 는 최대 GCE(Google Compute Engine) PD(영구 디스크) 수를 확인합니다.
{"name" : "MaxGCEPDVolumeCount"}
MatchInterPodAffinity 는 Pod 유사성/유사성 규칙에서 Pod를 허용하는지 확인합니다.
{"name" : "MatchInterPodAffinity"}
NoDiskConflict 는 Pod에서 요청한 볼륨을 사용할 수 있는지 확인합니다.
{"name" : "NoDiskConflict"}
PodToleratesNodeTaints 는 Pod에서 노드 테인트를 허용할 수 있는지 확인합니다.
{"name" : "PodToleratesNodeTaints"}
16.2.5.1.2. 기타 정적 서술자
OpenShift Container Platform에서는 다음과 같은 서술자도 지원합니다.
CheckVolumeBinding 은 Pod가 볼륨에 따라 적합할 수 있는지 평가합니다. * 바인딩된 PVC와 바인딩되지 않은 PVC 모두에 대해 요청합니다. * 서술자는 해당 PV의 노드 유사성이 지정된 노드에서 충족되는지 확인합니다. * 바인딩되지 않은 PVC의 경우 서술자는 PVC 요구 사항을 충족할 수 있는 사용 가능한 PV를 검색하고 PV 노드 유사성이 지정된 노드에 의해 충족되는지 확인합니다.
서술자는 바인딩된 모든 PVC에 노드와 호환되는 PV가 있고 바인딩되지 않은 모든 PVC를 사용 가능하고 노드와 호환되는 PV와 연결할 수 있는 경우 True를 반환합니다.
{"name" : "CheckVolumeBinding"}
CheckVolumeBinding
서술자는 기본이 아닌 스케줄러에서 활성화해야 합니다.
CheckNodeCondition 은 디스크 부족,네트워크를 사용할 수 없거나 준비되지 않은 상태를 보고하는 노드에 Pod를 예약할 수 있는지 확인합니다.
{"name" : "CheckNodeCondition"}
PodToleratesNodeNoExecuteTaints 는 Pod 허용 오차가 노드 NoExecute 테인트를 허용할 수 있는지 확인합니다.
{"name" : "PodToleratesNodeNoExecuteTaints"}
CheckNodeLabelPresence 는 값과 관계없이 지정된 라벨이 모두 노드에 있는지 확인합니다.
{"name" : "CheckNodeLabelPresence"}
checkServiceAffinity 는 노드에 예약된 Pod에 ServiceAffinity 라벨이 동종인지 확인합니다.
{"name" : "checkServiceAffinity"}
MaxAzureDiskVolumeCount 는 최대 Azure Disk 볼륨 수를 확인합니다.
{"name" : "MaxAzureDiskVolumeCount"}
16.2.5.2. 일반 서술자
다음 일반 서술자는 중요하지 않은 서술자 및 필수 서술자의 전달 여부를 확인합니다. 중요하지 않은 서술자는 중요하지 않은 Pod만 전달해야 하고 필수 서술자는 모든 Pod에서 전달해야 하는 서술자인 서술자입니다.
기본 스케줄러 정책에는 일반 서술자가 포함됩니다.
심각하지 않은 일반 서술자
PodFitsResources 는 리소스 가용성(CPU, 메모리, GPU 등)에 따라 적합성을 결정합니다. 노드는 해당 리소스 용량을 선언할 수 있으며 Pod는 필요한 리소스를 지정할 수 있습니다. 적합성은 사용된 리소스가 아닌 요청된 리소스를 기반으로 합니다.
{"name" : "PodFitsResources"}
필수 일반 서술자
PodFitsHostPorts 는 노드에 요청된 Pod 포트에 사용할 수 있는 포트가 있는지 여부를 결정합니다(포트 충돌).
{"name" : "PodFitsHostPorts"}
호스트 이름은 호스트 매개 변수 및 호스트 이름과 일치하는 문자열에 따라 적합성을 결정합니다.
{"name" : "HostName"}
MatchNodeSelector 는 Pod에 정의된 노드 선택기(nodeSelector) 쿼리에 따라 적합성을 결정합니다.
{"name" : "MatchNodeSelector"}
16.2.5.3. 구성 가능한 서술자
이러한 서술자를 기본적으로 /etc/origin/master/scheduler.json 으로 스케줄러 구성에서 구성하여 서술자 함수에 영향을 주는 라벨을 추가할 수 있습니다.
이러한 서술자는 구성 가능하므로 사용자 정의 이름이 다르면 동일한 유형(단일 구성 매개 변수)의 여러 서술자를 결합할 수 있습니다.
이러한 우선순위 사용에 대한 자세한 내용은 스케줄러 정책 수정을 참조하십시오.
ServiceAffinity 는 해당 Pod에서 실행되는 서비스를 기반으로 노드에 Pod를 배치합니다. 동일한 서비스의 Pod를 동일한 노드에 배치하거나 함께 배치하면 효율성이 향상될 수 있습니다.
이 서술자는 동일한 레이블이 있는 노드에서 특정 라벨이 있는 Pod를 노드 선택기 에 배치하려고 합니다.
Pod가 노드 선택기에서 레이블을 지정하지 않으면 첫 번째 Pod가 가용성에 따라 모든 노드에 배치되고 서비스의 모든 후속 포드는 해당 노드와 동일한 레이블 값이 있는 노드에 예약됩니다.
"predicates":[ { "name":"<name>", 1 "argument":{ "serviceAffinity":{ "labels":[ "<label>" 2 ] } } } ],
예를 들면 다음과 같습니다.
"name":"ZoneAffinity", "argument":{ "serviceAffinity":{ "labels":[ "rack" ] } }
예를 들어 서비스의 첫 번째 포드에 노드 선택기 랙
이 레이블 region=rack
이 있는 노드에 예약된 경우 동일한 서비스에 속하는 다른 모든 후속 포드가 동일한 region=rack
레이블이 있는 노드에 예약됩니다. 자세한 내용은 Pod 배치 제어를 참조하십시오.
다중 수준 레이블도 지원됩니다. 사용자는 동일한 지역 및 동일한 영역 내의 노드(지역별)에 예약되는 서비스에 대한 모든 Pod를 지정할 수도 있습니다.
labelsPresence
매개변수는 특정 노드에 특정 레이블이 있는지 확인합니다. 레이블은 LabelPreference
우선 순위에서 사용하는 노드 그룹을 생성합니다. 레이블 기반 일치는 노드의 실제 위치 또는 레이블로 정의된 상태가 있는 경우 유용할 수 있습니다.
"predicates":[ { "name":"<name>", 1 "argument":{ "labelsPresence":{ "labels":[ "<label>" 2 ], "presence": true 3 } } } ],
예를 들면 다음과 같습니다.
"name":"RackPreferred", "argument":{ "labelsPresence":{ "labels":[ "rack", "region" ], "presence": true } }
16.2.6. 사용 가능한 우선순위
우선순위는 기본 설정에 따라 나머지 노드의 순위를 지정하는 규칙입니다.
스케줄러를 구성하기 위해 사용자 정의 우선순위 집합을 지정할 수 있습니다. OpenShift Container Platform에는 기본적으로 제공되는 몇 가지 우선순위가 있습니다. 특정 매개변수를 제공하여 기타 우선순위를 사용자 정의할 수 있습니다. 여러 우선순위를 결합하고 각각 서로 다른 가중치를 부여하여 우선순위 지정에 영향을 미칠 수 있습니다.
16.2.6.1. 정적 우선순위
정적 우선순위에는 가중치를 제외하고 사용자의 구성 매개변수가 사용되지 않습니다. 가중치를 지정해야 하며 0 또는 음수를 사용할 수 없습니다.
이러한 값은 스케줄러 구성(기본적으로 /etc/origin/master/scheduler.json )에 지정됩니다.
16.2.6.1.1. 기본 우선순위
기본 스케줄러 정책에는 다음과 같은 우선순위가 포함됩니다. 가중치가 10000
인 NodePreferAvoidPodsPriority
를 제외하고 각 우선순위 함수의 가중치는 1
입니다.
SelectorSpreadPriority는 서비스, RC(복제 컨트롤러),RS(복제 집합), Pod와 일치하는 상태 저장 세트를 찾은 다음 해당 선택기와 일치하는 기존 Pod를 찾습니다. 스케줄러에서는 일치하는 기존 Pod가 적은 노드를 선호합니다. 그런 다음 Pod를 예약할 때 해당 선택기와 일치하는 Pod 수가 가장 적은 노드에 Pod를 예약합니다.
{"name" : "SelectorSpreadPriority", "weight" : 1}
InterPodAffinityPriority는 weighted PodAffinityTerm의 요소를 반복하고 해당 PodAffinityTerm이 해당 노드에 대해 충족되는 경우 합계에 가중치
를 추가하여 합계를 계산합니다. 합계가 가장 많은 노드를 가장 우선적으로 고려합니다.
{"name" : "InterPodAffinityPriority", "weight" : 1}
LeastRequestedPriority는 요청된 리소스가 적은 노드를 선호합니다. 노드에 예약된 Pod에서 요청한 메모리 및 CPU의 백분율을 계산하고 사용 가능한/남은 용량이 가장 많은 노드에 우선순위를 부여합니다.
{"name" : "LeastRequestedPriority", "weight" : 1}
BalancedResourceAllocation 은 리소스 사용률이 균형 있는 노드를 선호합니다. 사용한 CPU와 메모리 간의 차이를 용량의 일부로 계산하고 두 메트릭이 서로 얼마나 비슷한지에 따라 노드에 우선순위를 부여합니다. 이 우선순위는 항상 LeastRequestedPriority
와 함께 사용해야 합니다.
{"name" : "BalancedResourceAllocation", "weight" : 1}
NodePreferAvoidPodsPriority 는 복제 컨트롤러 이외의 컨트롤러에서 소유한 Pod를 무시합니다.
{"name" : "NodePreferAvoidPodsPriority", "weight" : 10000}
NodeAffinityPriority는 노드 유사성 스케줄링 기본 설정에 따라 노드에 우선순위를 부여합니다.
{"name" : "NodeAffinityPriority", "weight" : 1}
TaintTolerationPriority는 Pod 에 대해 허용 불가 테인트 수가 적은 노드에 우선순위를 부여합니다. 허용 불가 테인트에는 주요 PreferNoSchedule
이 있습니다.
{"name" : "TaintTolerationPriority", "weight" : 1}
16.2.6.1.2. 기타 정적 우선순위
OpenShift Container Platform에서는 다음과 같은 우선순위도 지원합니다.
EqualPriority 는 우선순위 구성이 제공되지 않는 경우 모든 노드에
동일한 가중치를 부여합니다. 이 우선순위는 테스트 환경에만 사용하는 것이 좋습니다.
{"name" : "EqualPriority", "weight" : 1}
MostRequestedPriority는 요청된 리소스가 가장 많은 노드에 우선순위를 부여합니다. 노드에 예약된 Pod에서 요청한 메모리와 CPU의 백분율을 계산하고 평균 용량 대비 요청 비율의 최댓값에 따라 우선순위를 부여합니다.
{"name" : "MostRequestedPriority", "weight" : 1}
ImageLocalityPriority는 요청된 Pod 컨테이너의 이미지가 이미 있는 노드에 우선순위를 부여합니다.
{"name" : "ImageLocalityPriority", "weight" : 1}
ServiceSpreadingPriority는 동일한 서비스에 속하는 Pod 수를 동일한 머신에 최소화하여 Pod를 확장합니다.
{"name" : "ServiceSpreadingPriority", "weight" : 1}
16.2.6.2. 구성 가능한 우선순위
이러한 우선순위를 기본적으로 /etc/origin/master/scheduler.json 으로 스케줄러 구성에서 구성하여 우선순위 방식에 영향을 주는 라벨을 추가할 수 있습니다.
우선순위 함수의 유형은 사용하는 인수로 확인됩니다. 이러한 우선순위는 구성 가능하므로 사용자 정의 이름이 다른 경우 유형은 동일하지만 구성 매개변수는 다른 우선순위 여러 개를 결합할 수 있습니다.
이러한 우선순위 사용에 대한 자세한 내용은 스케줄러 정책 수정을 참조하십시오.
ServiceAntiAffinity 는 레이블을 사용하여 레이블 값에 따라 동일한 서비스에 속하는 Pod를 노드 그룹에서 잘 분배합니다. 지정된 라벨에 동일한 값이 있는 모든 노드에 동일한 점수를 부여합니다. Pod 밀도가 가장 낮은 그룹 내의 노드에 더 높은 점수를 부여합니다.
"priorities":[ { "name":"<name>", 1 "weight" : 1 2 "argument":{ "serviceAntiAffinity":{ "label":[ "<label>" 3 ] } } } ]
예를 들면 다음과 같습니다.
"name":"RackSpread", 1 "weight" : 1 2 "argument":{ "serviceAntiAffinity":{ "label": "rack" 3 } }
사용자 정의 라벨에 따라 ServiceAntiAffinity
를 사용하는 일부 상황에서는 Pod를 예상대로 분배하지 않습니다. 이 Red Hat 솔루션을 참조하십시오.
* labelPreference
매개변수는 지정된 라벨에 따라 우선순위를 부여합니다. 라벨이 노드에 있으면 해당 노드에 우선순위가 부여됩니다. 라벨이 지정되지 않은 경우 라벨이 없는 노드에 우선순위가 부여됩니다.
"priorities":[ { "name":"<name>", 1 "weight" : 1, 2 "argument":{ "labelPreference":{ "label": "<label>", 3 "presence": true 4 } } } ]
16.2.7. 사용 사례
OpenShift Container Platform 내에서 예약하는 중요 사용 사례 중 하나는 유연한 유사성 및 유사성 방지 정책을 지원하는 것입니다.
16.2.7.1. 인프라 토폴로지 수준
관리자는 노드(예: region=r1,
지정하여 인프라(노드)에 여러 토폴로지 수준을 정의할 수 있습니다.
zone=z1
,rack=
s1)에 라벨을
이러한 레이블 이름은 특별한 의미가 없으며 관리자는 인프라 수준(예: 도시/빌딩/방)의 이름을 자유롭게 지정할 수 있습니다. 또한 관리자는 인프라 토폴로지에 원하는 수의 수준을 정의할 수 있으며 일반적으로 세 가지 수준이 적합합니다(예: region
→ zones
→ racks
). 관리자는 모든 조합에 유사성 및 유사성 방지 규칙을 지정할 수 있습니다.
16.2.7.2. 유사성
관리자는 임의의 토폴로지 수준 또는 여러 수준에도 유사성을 지정하도록 스케줄러를 구성할 수 있어야 합니다. 특정 수준의 유사성은 동일한 서비스에 속하는 모든 Pod가 동일한 수준에 속하는 노드에 예약됨을 나타냅니다. 이렇게 하면 관리자가 피어 Pod가 지리적으로 너무 멀리 떨어져 있지 않도록 할 수 있어 애플리케이션의 대기 시간 요구 사항이 처리됩니다. 동일한 유사성 그룹 내에서 Pod를 호스팅할 수 있는 노드가 없는 경우 Pod를 예약하지 않습니다.
Pod 예약 위치를 더 잘 제어해야 하는 경우 노드 유사성 및 Pod 유사성 사용을 참조하십시오. 관리자는 이러한 고급 예약 기능을 사용하여 Pod를 예약할 수 있는 노드를 지정하고 기타 Pod와 관련된 예약을 강제 적용하거나 거부할 수 있습니다.
16.2.7.3. 유사성 방지
관리자는 임의의 토폴로지 수준 또는 여러 수준에도 유사성 방지를 지정하도록 스케줄러를 구성할 수 있어야 합니다. 특정 수준의 유사성 방지(또는 '분배')는 동일한 서비스에 속하는 모든 Pod가 해당 수준에 속하는 노드에 분배되어 있음을 나타냅니다. 이 경우 고가용성을 위해 애플리케이션이 잘 분배됩니다. 스케줄러는 적용 가능한 모든 노드에서 가능한 한 균등하게 서비스 Pod의 균형을 맞추려고 합니다.
Pod 예약 위치를 더 잘 제어해야 하는 경우 노드 유사성 및 Pod 유사성 사용을 참조하십시오. 관리자는 이러한 고급 예약 기능을 사용하여 Pod를 예약할 수 있는 노드를 지정하고 기타 Pod와 관련된 예약을 강제 적용하거나 거부할 수 있습니다.
16.2.8. 정책 구성 샘플
아래 구성은 스케줄러 정책 파일을 통해 지정하는 경우 기본 스케줄러 구성을 지정합니다.
kind: "Policy" version: "v1" predicates: ... - name: "RegionZoneAffinity" 1 argument: serviceAffinity: 2 labels: 3 - "region" - "zone" priorities: ... - name: "RackSpread" 4 weight: 1 argument: serviceAntiAffinity: 5 label: "rack" 6
아래의 모든 샘플 구성에서 서술자 및 우선순위 함수 목록은 지정된 사용 사례와 관련된 항목만 포함하도록 잘립니다. 실제로 완료된/유의미한 스케줄러 정책에는 위에 나열된 기본 서술자 및 우선순위 전부는 아니더라도 대부분이 포함되어야 합니다.
다음 예제에서는 세 가지 토폴로지 수준, 즉 region(유사성) → zone(유사성) → rack(유사성 방지)을 정의합니다.
kind: "Policy" version: "v1" predicates: ... - name: "RegionZoneAffinity" argument: serviceAffinity: labels: - "region" - "zone" priorities: ... - name: "RackSpread" weight: 1 argument: serviceAntiAffinity: label: "rack"
다음 예제에서는 세 가지 토폴로지 수준, 즉 city(유사성) → building(유사성 방지) → room(유사성 방지)을 정의합니다.
kind: "Policy" version: "v1" predicates: ... - name: "CityAffinity" argument: serviceAffinity: labels: - "city" priorities: ... - name: "BuildingSpread" weight: 1 argument: serviceAntiAffinity: label: "building" - name: "RoomSpread" weight: 1 argument: serviceAntiAffinity: label: "room"
다음 예제에서는 'region' 라벨이 정의된 노드만 사용하고 'zone' 라벨이 정의된 노드를 선호하는 정책을 정의합니다.
kind: "Policy" version: "v1" predicates: ... - name: "RequireRegion" argument: labelsPresence: labels: - "region" presence: true priorities: ... - name: "ZonePreferred" weight: 1 argument: labelPreference: label: "zone" presence: true
다음 예제에서는 정적 및 구성 가능 서술자와 우선순위를 둘 다 결합합니다.
kind: "Policy" version: "v1" predicates: ... - name: "RegionAffinity" argument: serviceAffinity: labels: - "region" - name: "RequireRegion" argument: labelsPresence: labels: - "region" presence: true - name: "BuildingNodesAvoid" argument: labelsPresence: labels: - "building" presence: false - name: "PodFitsPorts" - name: "MatchNodeSelector" priorities: ... - name: "ZoneSpread" weight: 2 argument: serviceAntiAffinity: label: "zone" - name: "ZonePreferred" weight: 1 argument: labelPreference: label: "zone" presence: true - name: "ServiceSpreadingPriority" weight: 1
16.3. 일정 변경
16.3.1. 개요
예약 취소는 특정 정책에 따라 Pod를 제거하여 보다 적절한 노드에 Pod를 다시 예약할 수 있도록 합니다.
클러스터는 다양한 이유로 이미 실행 중인 Pod를 스케줄링하고 다시 스케줄링할 수 있습니다.
- 노드가 활용도가 낮거나 과도하게 사용됨.
- 오염 또는 라벨과 같은 Pod 및 노드 선호도 요구 사항이 변경되었으며, 원래 일정 결정이 더 이상 특정 노드에 적합하지 않습니다.
- 노드 장애로 Pod를 이동해야 합니다.
- 새 노드가 클러스터에 추가되었습니다.
Descheduler는 제거된 Pod의 교체를 예약하지 않습니다. 제거된 Pod에 대해 스케줄러 에서 이 작업을 자동으로 수행합니다.
완전히 작동하는 클러스터에 중요하지만 마스터가 아닌 일반 클러스터 노드에서 실행되는 DNS와 같은 여러 핵심 구성 요소가 있다는 점에 유의해야 합니다. 구성 요소가 제거되면 클러스터가 제대로 작동하지 않을 수 있습니다. Descheduler가 이러한 Pod를 제거하지 않도록 하려면 scheduler.alpha.kubernetes.io/critical-pod
주석을 Pod 사양에 추가하여 Pod를 중요한 Pod로 구성합니다.
Descheduler 작업은 중요한 Pod로 간주되어 Descheduler Pod가 Descheduler Pod가 제거되지 않도록 합니다.
Descheduler 작업 및 Descheduler Pod는 기본적으로 생성된 kube-system
프로젝트에 생성됩니다.
Descheduler는 기술 프리뷰 기능 전용입니다. 기술 프리뷰 기능은 Red Hat 프로덕션 서비스 수준 계약(SLA)에서 지원하지 않으며, 기능상 완전하지 않을 수 있어 프로덕션에 사용하지 않는 것이 좋습니다. 이러한 기능을 사용하면 향후 제품 기능을 조기에 이용할 수 있어 개발 과정에서 고객이 기능을 테스트하고 피드백을 제공할 수 있습니다.
Red Hat 기술 프리뷰 기능 지원 범위에 대한 자세한 내용은 https://access.redhat.com/support/offerings/techpreview/를 참조하십시오.
Descheduler는 다음 유형의 Pod를 제거하지 않습니다.
-
중요한 Pod(
scheduler.alpha.kubernetes.io/critical-pod
주석 포함). - Pod(독립 실행형 모드에서정적 및 미러 Pod 또는 Pod)는 복제 세트, 복제 컨트롤러, 배포 또는 작업(이러한 Pod가 재생성되지 않기 때문에)과 연결되어 있지 않습니다.
- DaemonSet과 연결된 Pod.
- 로컬 스토리지가 있는 pod
- PDB(Pod Disruption Budget)가 적용되는 Pod 는 PDB를 위반하는 경우 제거되지 않습니다. Pod는 제거 정책을 사용하여 제거할 수 있습니다.
Burstable 및 Guaranteed Pod보다 최상의 Pod가 제거됩니다.
다음 섹션에서는 Descheduler를 구성하고 실행하는 프로세스를 설명합니다.
- 역할을 만듭니다.
- 정책 파일에서 일정 변경 동작을 정의합니다.
- 정책 파일을 참조할 구성 맵을 생성합니다.
- Descheduler 작업 구성을 생성합니다.
- Descheduler 작업을 실행합니다.
16.3.2. 클러스터 역할 생성
Descheduler가 Pod에서 작동하는 데 필요한 권한을 구성하려면 다음을 수행합니다.
다음 규칙을 사용하여 클러스터 역할을 생성합니다.
kind: ClusterRole apiVersion: rbac.authorization.k8s.io/v1beta1 metadata: name: descheduler-cluster-role rules: - apiGroups: [""] resources: ["nodes"] verbs: ["get", "watch", "list"] 1 - apiGroups: [""] resources: ["pods"] verbs: ["get", "watch", "list", "delete"] 2 - apiGroups: [""] resources: ["pods/eviction"] 3 verbs: ["create"]
작업을 실행하는 데 사용할 서비스 계정을 생성합니다.
# oc create sa <file-name>.yaml -n kube-system
예를 들면 다음과 같습니다.
# oc create sa descheduler-sa.yaml -n kube-system
클러스터 역할을 서비스 계정에 바인딩합니다.
# oc create clusterrolebinding descheduler-cluster-role-binding \ --clusterrole=<cluster-role-name> \ --serviceaccount=kube-system:<service-account-name>
예를 들면 다음과 같습니다.
# oc create clusterrolebinding descheduler-cluster-role-binding \ --clusterrole=descheduler-cluster-role \ --serviceaccount=kube-system:descheduler-sa
16.3.3. Descheduler 정책 생성
YAML 정책 파일의 전략에 의해 정의된 규칙을 위반하는 노드에서 Pod를 제거하도록 Descheduler를 구성할 수 있습니다. 그런 다음 특정 계획 전략을 적용하기 위해 해당 구성 맵을 사용하여 정책 파일의 경로와 작업 사양을 포함하는 구성 맵을 생성합니다.
Descheduler 정책 파일 샘플
apiVersion: "descheduler/v1alpha1" kind: "DeschedulerPolicy" strategies: "RemoveDuplicates": enabled: false "LowNodeUtilization": enabled: true params: nodeResourceUtilizationThresholds: thresholds: "cpu" : 20 "memory": 20 "pods": 20 targetThresholds: "cpu" : 50 "memory": 50 "pods": 50 numberOfNodes: 3 "RemovePodsViolatingInterPodAntiAffinity": enabled: true "RemovePodsViolatingNodeAffinity": enabled: true params: nodeAffinityType: - "requiredDuringSchedulingIgnoredDuringExecution"
Descheduler와 함께 사용할 수 있는 세 가지 기본 전략이 있습니다.
필요에 따라 전략과 관련된 매개변수를 구성하고 비활성화할 수 있습니다.
16.3.3.1. 중복 Pod 제거
RemoveDuplicates
전략을 사용하면 동일한 노드에서 실행 중인 복제본 세트,복제 컨트롤러,배포 구성 또는 작업과 연결된 Pod가 하나만 있는지 확인합니다. 이러한 오브젝트와 연결된 다른 Pod가 있는 경우 중복된 Pod가 제거됩니다. 중복된 Pod를 제거하면 클러스터에 Pod가 분산됩니다.
예를 들어 노드가 실패하고 노드의 Pod가 다른 노드로 이동되어 동일한 노드에서 실행 중인 Replica Set 또는 Replication 컨트롤러와 연결된 두 개 이상의 Pod가 있는 경우 중복 Pod가 발생할 수 있습니다. 오류가 발생한 노드가 다시 준비되면 이 전략을 사용하여 중복된 포드를 제거할 수 있습니다.
이 전략과 연결된 매개 변수가 없습니다.
apiVersion: "descheduler/v1alpha1"
kind: "DeschedulerPolicy"
strategies:
"RemoveDuplicates":
enabled: false 1
- 1
- 이 정책을 사용하려면 이 값을
enabled: true
로 설정합니다. 이 정책을 비활성화하려면false로
설정합니다.
16.3.3.2. 낮은 노드 사용률 정책 생성
LowNodeUtilization
전략은 활용도가 낮은 노드를 찾아 이러한 활용도가 낮은 노드에서 제거된 Pod를 예약할 수 있도록 다른 노드에서 Pod를 제거합니다.
노드 활용도가 낮은 경우 구성 가능한 임계값, 임계값
, CPU, 메모리 또는 Pod 수(백분율에 따라)가 결정됩니다. 노드 사용량이 이러한 임계값이 모두 낮은 경우 노드가 활용도가 낮은 것으로 간주되고 Descheduler가 다른 노드에서 Pod를 제거할 수 있습니다. 컴퓨팅 노드 리소스 사용률은 포드 요청 리소스 요구 사항을 고려합니다.
높은 임계값인 targetThresholds
는 적절하게 사용되는 노드를 결정하는 데 사용됩니다. 임계값 과 targetThresholds 사이의 노드는 제대로 사용되는 것으로 간주되며 제거로 간주되지 않습니다. CPU, 메모리, Pod 수(% 기반)에 대해 targetThresholds
를 구성할 수 있습니다.
이러한 임계값은 클러스터 요구 사항에 맞게 조정할 수 있습니다.
numberOfNodes
매개변수는 활용도가 낮은 노드 수가 구성된 값보다 큰 경우에만 전략을 활성화하도록 구성할 수 있습니다. 몇 개의 노드가 활용도가 낮은 경우 이 매개 변수를 설정합니다. 기본적으로 numberOfNodes
는 0으로 설정됩니다.
apiVersion: "descheduler/v1alpha1" kind: "DeschedulerPolicy" strategies: "LowNodeUtilization": enabled: true params: nodeResourceUtilizationThresholds: thresholds: 1 "cpu" : 20 "memory": 20 "pods": 20 targetThresholds: 2 "cpu" : 50 "memory": 50 "pods": 50 numberOfNodes: 3 3
16.3.3.3. Pod 간 유사성 위반 제거
RemovePodsViolatingInterPodAntiAffinity
전략은 Pod 간 유사성 방지를 위반하는 Pod가 노드에서 제거되도록 합니다.
예를 들어 Node1 에는 podA,podB 및 podC 가 있습니다. podB 및 podC 에는 Pod A 와 동일한 노드에서 실행되지 않는 유사성 방지 규칙이 있습니다.podA 는 해당 노드에서 podB 및 pod C 를 실행할 수 있도록 노드에서 제거됩니다. 이 상황은 podB 및 pod C 가 노드에서 실행될 때 유사성 방지 규칙이 적용된 경우 발생할 수 있습니다.
apiVersion: "descheduler/v1alpha1"
kind: "DeschedulerPolicy"
strategies:
"RemovePodsViolatingInterPodAntiAffinity": 1
enabled: true
- 1
- 이 정책을 사용하려면 이 값을
enabled: true
로 설정합니다. 이 정책을 비활성화하려면false로
설정합니다.
16.3.3.4. Pod Volating Node Affinity 제거
RemovePodsViolatingNodeAffinity
전략을 사용하면 노드 유사성을 위반하는 모든 Pod가 노드에서 제거됩니다. 노드가 더 이상 Pod의 선호도 규칙을 충족하지 않는 경우 이러한 상황이 발생할 수 있습니다. 유사성 규칙을 충족하는 다른 노드를 사용할 수 있는 경우 Pod가 제거됩니다.
예를 들어 노드가 예약 시 requiredDuringSchedulingIgnoredDuringExecution
노드 유사성 규칙을 만족하기 때문에 podA 는 nodeA에 예약됩니다. nodeA 가 규칙을 충족하는 것을 중지하고 노드 선호도 규칙을 충족하는 다른 노드가 있는 경우 전략은 node A에서 pod A 를 제거하고 다른 노드로 이동합니다.
apiVersion: "descheduler/v1alpha1" kind: "DeschedulerPolicy" strategies: "RemovePodsViolatingNodeAffinity": 1 enabled: true params: nodeAffinityType: - "requiredDuringSchedulingIgnoredDuringExecution" 2
16.3.4. Descheduler 정책에 대한 구성 맵 생성
Descheduler 작업에서 참조할 수 있도록 kube-system
프로젝트에서 Descheduler 정책 파일에 대한 구성 맵을 생성합니다.
# oc create configmap descheduler-policy-configmap \
-n kube-system --from-file=<path-to-policy-dir/policy.yaml> 1
- 1
- 생성한 정책 파일의 경로입니다.
16.3.5. 작업 사양 만들기
Descheduler에 대한 작업 구성을 생성합니다.
apiVersion: batch/v1 kind: Job metadata: name: descheduler-job namespace: kube-system spec: parallelism: 1 completions: 1 template: metadata: name: descheduler-pod 1 annotations: scheduler.alpha.kubernetes.io/critical-pod: "true" 2 spec: containers: - name: descheduler image: registry.access.redhat.com/openshift3/ose-descheduler volumeMounts: 3 - mountPath: /policy-dir name: policy-volume command: - "/bin/sh" - "-ec" - | /bin/descheduler --policy-config-file /policy-dir/policy.yaml 4 restartPolicy: "Never" serviceAccountName: descheduler-sa 5 volumes: - name: policy-volume configMap: name: descheduler-policy-configmap
정책 파일은 구성 맵에서 볼륨으로 마운트됩니다.
16.3.6. Descheduler 실행
Pod에서 Descheduler를 작업으로 실행하려면 다음을 수행합니다.
# oc create -f <file-name>.yaml
예를 들면 다음과 같습니다.
# oc create -f descheduler-job.yaml
16.4. 사용자 정의 스케줄링
16.4.1. 개요
기본 스케줄러와 함께 여러 사용자 정의 스케줄러를 실행하고 각 Pod에 사용할 스케줄러를 구성할 수 있습니다.
특정 스케줄러를 사용하여 지정된 Pod를 예약하려면 해당 Pod 사양에서 스케줄러의 이름을 지정합니다.
스케줄러 바이너리를 생성하는 방법에 대한 정보는 이 문서의 범위를 벗어납니다. 예를 들어 Kubernetes 문서 의 다중 스케줄러 구성을 참조하십시오.
16.4.2. 스케줄러 패키지
클러스터에 사용자 지정 스케줄러를 포함하는 일반적인 프로세스에는 배포에 해당 이미지를 포함하여 이미지를 생성해야 합니다.
- 스케줄러 바이너리를 컨테이너 이미지로 패키징합니다.
스케줄러 바이너리를 포함하는 컨테이너 이미지를 생성합니다.
예를 들면 다음과 같습니다.
FROM <source-image> ADD <path-to-binary> /usr/local/bin/kube-scheduler
파일을 Dockerfile로 저장하고 이미지를 빌드한 다음 레지스트리에 내보냅니다.
예를 들면 다음과 같습니다.
docker build -t <dest_env_registry_ip>:<port>/<namespace>/<image name>:<tag> docker push <dest_env_registry_ip>:<port>/<namespace>/<image name>:<tag>
OpenShift Container Platform에서 사용자 정의 스케줄러에 대한 배포를 생성합니다.
apiVersion: v1 kind: ServiceAccount metadata: name: custom-scheduler namespace: kube-system --- apiVersion: rbac.authorization.k8s.io/v1 kind: ClusterRoleBinding metadata: name: custom-scheduler subjects: - kind: ServiceAccount name: custom-scheduler namespace: kube-system roleRef: kind: ClusterRole name: system:kube-scheduler apiGroup: rbac.authorization.k8s.io --- apiVersion: apps/v1 kind: Deployment metadata: name: custom-scheduler namespace: kube-system labels: app: custom-scheduler spec: replicas: 1 selector: matchLabels: app: custom-scheduler template: metadata: labels: app: custom-scheduler spec: serviceAccount: custom-scheduler containers: - name: custom-scheduler image: "<namespace>/<image name>:<tag>" 1 imagePullPolicy: Always
- 1
- 사용자 정의 스케줄러에 대해 생성한 컨테이너 이미지를 지정합니다.
16.4.3. 사용자 정의 스케줄러를 사용하여 Pod 배포
사용자 정의 스케줄러가 클러스터에 배포된 후 기본 스케줄러 대신 해당 스케줄러를 사용하도록 Pod를 구성할 수 있습니다.
Pod 구성을 생성하거나 편집하고 scheduler
Name
매개변수를 사용하여 스케줄러 이름을 지정합니다. 이름은 고유해야 합니다.스케줄러를 사용한 샘플 Pod 사양
apiVersion: v1 kind: Pod metadata: name: custom-scheduler-example labels: name: custom-scheduler-example spec: schedulerName: custom-scheduler 1 containers: - name: pod-with-second-annotation-container image: docker.io/ocpqe/hello-pod
- 1
- 사용할 스케줄러의 이름입니다. 스케줄러 이름을 제공하지 않으면 기본 스케줄러를 사용하여 Pod가 자동으로 예약됩니다.
다음 명령을 실행하여 Pod를 생성합니다.
$ oc create -f <file-name>.yaml
예를 들면 다음과 같습니다.
$ oc create -f custom-scheduler-example.yaml
다음 명령을 실행하여 Pod가 생성되었는지 확인합니다.
$ oc get pod <file-name>
예를 들면 다음과 같습니다.
$ oc get pod custom-scheduler-example NAME READY STATUS RESTARTS AGE custom-scheduler-example 1/1 Running 0 4m
다음 명령을 실행하여 사용자 정의 스케줄러에서 Pod를 예약했는지 확인합니다.
$ oc describe pod <pod-name>
예를 들면 다음과 같습니다.
$ oc describe pod custom-scheduler-example
다음 잘린 출력에 표시된 대로 스케줄러의 이름이 나열됩니다.
... Events: FirstSeen LastSeen Count From SubObjectPath Type Reason Message --------- -------- ----- ---- ------------- -------- ------ ------- 1m 1m 1 custom-scheduler Normal Scheduled Successfully assigned custom-scheduler to <$node1> ...
16.5. Pod 배치 제어
16.5.1. 개요
클러스터 관리자는 Pod를 예약할 때 특정 역할을 가진 애플리케이션 개발자가 특정 노드를 대상으로 하지 못하도록 정책을 설정할 수 있습니다.
Pod 노드 제한 허용 컨트롤러는 라벨을 사용하여 지정된 노드 호스트에만 Pod를 배포하고 특정 역할이 없는 사용자가 nodeSelector
필드를 사용하여 Pod를 예약하지 않도록 합니다.
16.5.2. 노드 이름을 사용하여 구성 Pod 배치
Pod 노드 제약 조건 승인 컨트롤러를 사용하여 Pod가 레이블을 할당하고 Pod 구성의 node Name 설정에서 이를 지정하여 지정된 노드
호스트에만 배포되도록 합니다.
원하는 라벨(자세한 내용은 노드의 라벨 업데이트 참조 ) 및 환경에 설정된 노드 선택기 가 있는지 확인합니다.
예를 들어 Pod 구성에 원하는 라벨을 나타내는
nodeName
값이 포함되어 있는지 확인합니다.apiVersion: v1 kind: Pod spec: nodeName: <value>
마스터 구성 파일 /etc/origin/master/master-config.yaml 을 수정하여
admissionConfig
섹션에PodNodeConstraints
를 추가합니다.... admissionConfig: pluginConfig: PodNodeConstraints: configuration: apiversion: v1 kind: PodNodeConstraintsConfig ...
변경 사항을 적용하려면 OpenShift Container Platform을 다시 시작하십시오.
# master-restart api # master-restart controllers
16.5.3. 노드 선택기를 사용하여 구성 Pod 배치
노드 선택기를 사용하면 Pod가 특정 라벨이 있는 노드에만 배치되도록 할 수 있습니다. 클러스터 관리자는 Pod 노드 제약 조건 승인 컨트롤러를 사용하여 Pod /바인딩 권한이 없는 사용자가 노드 선택기를 사용하여 Pod 를 예약하지 못하도록 하는 정책을 설정할 수 있습니다.
마스터 구성 파일의 nodeSelectorLabelBlacklist
필드를 사용하면 특정 역할이 Pod 구성의 nodeSelector
필드에서 지정할 수 있는 라벨을 제어할 수 있습니다. pod/binding 권한 역할이 있는 사용자, 서비스 계정 및 그룹은 노드 선택기를 지정할 수 있습니다. pod/binding 권한이 없는 사용자는 nodeSelector LabelBlacklist에 표시되는 모든 라벨에 대해
를 설정할 수 없습니다.
nodeSelector
예를 들어 OpenShift Container Platform 클러스터는 두 지역에 분산된 데이터 센터 5개로 구성될 수 있습니다. 미국, us-east, us-central, us - west 및 아시아 태평양 지역(APAC), apac-east 및 apac-west 에서. 각 지역에 있는 각 노드는 그에 따라 레이블이 지정됩니다. 예를 들어 region: us-east
입니다.
라벨 할당에 대한 자세한 내용은 노드의 라벨 업데이트를 참조하십시오.
클러스터 관리자는 애플리케이션 개발자가 지리적 위치에 가장 가까운 노드에만 포드를 배포해야 하는 인프라를 생성할 수 있습니다. 미국 데이터 센터를 슈퍼 지역으로 그룹화하는 노드 선택기를 생성할 수 있습니다. us 및 APAC 데이터 센터를
로 그룹화할 수 있습니다.
superregion:
apac
데이터 센터당 리소스를 로드하도록 원하는 지역을
마스터 구성의 nodeSelectorLabelBlacklist
섹션에 추가할 수 있습니다. 그런 다음, 미국 내에 있는 개발자가 포드를 생성할 때마다 수퍼 영역인 us
레이블이 있는 지역 중 하나에 있는 노드에 배포됩니다. 개발자가 포드의 특정 리전을 대상으로 시도하는 경우(예 : region: us-east
) 오류가 발생합니다. 포드에서 노드 선택기 없이 다시 시도하면 superregion: us가 프로젝트 수준 노드 선택기로 설정되어 있고 region : us
배포할 수 있습니다 -east의 레이블이 지정된 노드에 superregion
: us라는 레이블이 지정되므로 여전히 대상 리전에.
원하는 라벨(자세한 내용은 노드의 라벨 업데이트 참조 ) 및 환경에 설정된 노드 선택기 가 있는지 확인합니다.
예를 들어 Pod 구성에 원하는 라벨을 나타내는
nodeSelector
값이 포함되어 있는지 확인합니다.apiVersion: v1 kind: Pod spec: nodeSelector: <key>: <value> ...
마스터 구성 파일 /etc/origin/master/master-config.yaml 을 수정하여 pod 배치를 거부할 노드 호스트에 할당된 라벨을 사용하여
nodeSelectorLabelBlacklist
를admissionConfig
섹션에 추가합니다.... admissionConfig: pluginConfig: PodNodeConstraints: configuration: apiversion: v1 kind: PodNodeConstraintsConfig nodeSelectorLabelBlacklist: - kubernetes.io/hostname - <label> ...
변경 사항을 적용하려면 OpenShift Container Platform을 다시 시작하십시오.
# master-restart api # master-restart controllers
16.5.4. 프로젝트에 Pod 배치 제어
Pod 노드 선택기 승인 컨트롤러를 사용하면 특정 프로젝트와 연결된 노드에 Pod를 강제 적용하고 해당 노드에서 Pod가 예약되지 않도록 할 수 있습니다.
Pod 노드 선택기 승인 컨트롤러는 Pod 에 지정된 프로젝트 및 노드 선택기의 라벨을 사용하여 Pod를 배치할 수 있는 위치를 결정합니다. 포드의 노드 선택기가 프로젝트의 라벨과 일치하는 경우에만 프로젝트와 연결된 노드에 새 포드가 배치됩니다.
Pod가 생성되면 노드 선택기가 Pod에 병합되므로 Pod 사양에 원래 사양에 포함된 라벨과 노드 선택기의 새 라벨이 포함됩니다. 아래 예제에서는 병합 효과를 보여줍니다.
Pod 노드 선택기 승인 컨트롤러를 사용하면 특정 프로젝트에서 허용되는 라벨 목록을 생성할 수도 있습니다. 이 목록은 개발자가 프로젝트에서 사용할 수 있는 레이블을 알 수 있도록 하는 허용 목록 역할을 하며 관리자에게 클러스터에서 레이블 지정을 더욱 효과적으로 제어할 수 있도록 합니다.
Pod 노드 선택기 승인 컨트롤러를 활성화하려면 다음을 수행합니다.
다음 방법 중 하나를 사용하여 Pod 노드 선택기 승인 컨트롤러 및 허용 목록을 구성합니다.
마스터 구성 파일 /etc/origin/master/master-config.yaml에 다음을 추가합니다.
admissionConfig: pluginConfig: PodNodeSelector: configuration: podNodeSelectorPluginConfig: 1 clusterDefaultNodeSelector: "k3=v3" 2 ns1: region=west,env=test,infra=fedora,os=fedora 3
승인 컨트롤러 정보가 포함된 파일을 생성합니다.
podNodeSelectorPluginConfig: clusterDefaultNodeSelector: "k3=v3" ns1: region=west,env=test,infra=fedora,os=fedora
그런 다음 마스터 구성에서 파일을 참조합니다.
admissionConfig: pluginConfig: PodNodeSelector: location: <path-to-file>
참고프로젝트에 노드 선택기가 지정되지 않은 경우 기본 노드 선택기(cluster
DefaultNodeSelector)를 사용하여 해당 프로젝트와 연결된 Pod가
병합됩니다.
변경 사항을 적용하려면 OpenShift Container Platform을 다시 시작하십시오.
# master-restart api # master-restart controllers
scheduler.alpha.kubernetes.io/node-selector
주석 및 라벨이 포함된 프로젝트 오브젝트를 생성합니다.apiVersion: v1 kind: Namespace metadata name: ns1 annotations: scheduler.alpha.kubernetes.io/node-selector: env=test,infra=fedora 1 spec: {}, status: {}
- 1
- 프로젝트 레이블 선택기와 일치하도록 라벨을 생성하는 주석입니다. 여기서 키/값 레이블은
env=test
및infra=fedora
입니다.
참고Pod 노드 선택기 승인 컨트롤러를 사용하는 경우 프로젝트 노드 선택기를 설정하는 데
oc adm new-project <project-name>
을 사용할 수 없습니다.oc adm new-project myproject --node-selector='type=user-node,region=<region>
명령을 사용하여 프로젝트 노드 선택기를 설정하는 경우 OpenShift Container Platform은 NodeEnv 승인 플러그인에서 처리하는openshift.io/node-selector
주석을 설정합니다.노드 선택기에 라벨을 포함하는 Pod 사양을 생성합니다. 예를 들면 다음과 같습니다.
apiVersion: v1 kind: Pod metadata: labels: name: hello-pod name: hello-pod spec: containers: - image: "docker.io/ocpqe/hello-pod:latest" imagePullPolicy: IfNotPresent name: hello-pod ports: - containerPort: 8080 protocol: TCP resources: {} securityContext: capabilities: {} privileged: false terminationMessagePath: /dev/termination-log dnsPolicy: ClusterFirst restartPolicy: Always nodeSelector: 1 env: test os: fedora serviceAccount: "" status: {}
- 1
- 프로젝트 레이블과 일치하는 노드 선택기입니다.
프로젝트에서 Pod를 생성합니다.
# oc create -f pod.yaml --namespace=ns1
노드 선택기 레이블이 Pod 구성에 추가되었는지 확인합니다.
get pod pod1 --namespace=ns1 -o json nodeSelector": { "env": "test", "infra": "fedora", "os": "fedora" }
노드 선택기는 Pod에 병합되고 Pod를 적절한 프로젝트에 예약해야 합니다.
프로젝트 사양에 지정되지 않은 라벨을 사용하여 Pod를 생성하는 경우 Pod가 노드에 예약되지 않습니다.
예를 들어 여기서 레이블 env: production
은 프로젝트 사양에 없습니다.
nodeSelector: "env: production" "infra": "fedora", "os": "fedora"
노드 선택기 주석이 없는 노드가 있는 경우 해당 노드에 Pod가 예약됩니다.
16.6. Pod 우선 순위 및 선점
16.6.1. Pod 우선순위 및 선점 적용
클러스터에서 Pod 우선순위 및 선점을 활성화할 수 있습니다. Pod 우선 순위는 다른 Pod를 기준으로 Pod의 중요성을 나타내고 해당 우선 순위에 따라 Pod를 큐에 지정합니다. Pod 선점을 사용하면 클러스터에서 우선순위가 낮은 Pod를 제거하거나 선점할 수 있으므로 적절한 노드 Pod 우선순위에 사용 가능한 공간이 없는 경우 우선순위가 높은 Pod를 예약할 수 있습니다. 또한 노드의 Pod 예약 순서에 영향을 미칩니다.
우선순위 및 선점 기능을 사용하려면 Pod의 상대적 가중치를 정의하는 우선순위 클래스를 생성합니다. 그런 다음 Pod 사양의 우선순위 클래스를 참조하여 예약에 해당 값을 적용합니다.
선점은 스케줄러 구성 파일의 disablePreemption
매개변수로 제어되며 기본적으로 false
로 설정됩니다.
16.6.2. Pod 우선순위 정보
Pod 우선 순위 및 선점 기능이 활성화되면 스케줄러는 보류 중인 Pod를 우선 순위에 따라 주문하고 보류 중인 Pod는 예약 큐에서 우선 순위가 낮은 다른 보류 중인 Pod보다 먼저 배치됩니다. 그 결과 예약 요구 사항이 충족되는 경우 우선순위가 높은 Pod가 우선순위가 낮은 Pod보다 더 빨리 예약될 수 있습니다. Pod를 예약할 수 없는 경우에는 스케줄러에서 우선순위가 낮은 다른 Pod를 계속 예약합니다.
16.6.2.1. Pod 우선순위 클래스
네임스페이스가 지정되지 않은 오브젝트로서 이름에서 우선순위 정수 값으로의 매핑을 정의하는 우선순위 클래스를 Pod에 할당할 수 있습니다. 값이 클수록 우선순위가 높습니다.
우선순위 클래스 오브젝트에는 1000000000(10억)보다 작거나 같은 32비트 정수 값을 사용할 수 있습니다. 선점하거나 제거해서는 안 되는 중요한 Pod의 경우 10억보다 큰 숫자를 예약합니다. 기본적으로 OpenShift Container Platform에는 중요한 시스템 Pod의 예약을 보장하기 위해 우선순위 클래스가 2개 예약되어 있습니다.
- system-node-critical - 이 우선순위 클래스의 값은 2000001000이며 노드에서 제거해서는 안 되는 모든 Pod에 사용됩니다. 이 우선순위 클래스가 있는 Pod의 예로는 sdn-ovs, sdn 등이 있습니다.
-
system-cluster-critical - 이 우선순위 클래스의 값은 2000000000(10억)이며 클러스터에 중요한 Pod와 함께 사용됩니다. 이 우선순위 클래스가 있는 Pod는 특정 상황에서 노드에서 제거할 수 있습니다. 예를 들어
system-node-critical
우선순위 클래스를 사용하여 구성한 Pod가 우선할 수 있습니다. 그러나 이 우선순위 클래스는 예약을 보장합니다. 이 우선순위 클래스를 사용할 수 있는 Pod의 예로는 fluentd, Descheduler와 같은 추가 기능 구성 요소 등이 있습니다.
기존 클러스터를 업그레이드하는 경우 기존 Pod의 우선순위는 사실상 0입니다. 그러나 scheduler.alpha.kubernetes.io/critical-pod
주석이 있는 기존 Pod는 자동으로 system-cluster-critical
클래스로 변환됩니다.
16.6.2.2. Pod 우선순위 이름
우선순위 클래스가 하나 이상 있으면 Pod 사양에서 우선순위 클래스 이름을 지정하는 Pod를 생성할 수 있습니다. 우선순위 승인 컨트롤러는 우선순위 클래스 이름 필드를 사용하여 정수 값으로 된 우선순위를 채웁니다. 이름이 지정된 우선순위 클래스가 없는 경우 Pod가 거부됩니다.
다음 YAML은 이전 예제에서 생성된 우선 순위 클래스를 사용하는 포드 구성의 예입니다. 우선순위 승인 컨트롤러는 사양을 확인하고 Pod의 우선 순위를 1000000으로 확인합니다.
16.6.3. Pod 선점 정보
개발자가 Pod를 생성하면 Pod가 큐로 들어갑니다. Pod 우선 순위 및 선점 기능이 활성화되면 스케줄러는 대기열에서 Pod를 선택하고 노드에서 Pod를 예약하려고 합니다. 스케줄러가 노드에서 Pod의 지정된 요구 사항을 모두 충족하는 적절한 공간을 찾을 수 없는 경우 보류 중인 Pod에 대한 선점 논리가 트리거됩니다.
스케줄러가 노드에서 하나 이상의 Pod를 선점하면 우선순위가 높은 Pod 사양의 nominatedNodeName
필드가 nodename
필드와 함께 노드의 이름으로 설정됩니다. 스케줄러는 nominatedNodeName
필드를 사용하여 Pod용으로 예약된 리소스를 계속 추적하고 클러스터의 선점에 대한 정보도 사용자에게 제공합니다.
스케줄러에서 우선순위가 낮은 Pod를 선점한 후에는 Pod의 정상 종료 기간을 따릅니다. 스케줄러에서 우선순위가 낮은 Pod가 종료되기를 기다리는 동안 다른 노드를 사용할 수 있게 되는 경우 스케줄러는 해당 노드에서 우선순위가 더 높은 Pod를 예약할 수 있습니다. 결과적으로 Pod 사양의 nominatedNodeName
필드 및 nodeName
필드가 다를 수 있습니다.
또한 스케줄러가 노드의 Pod를 선점하고 종료되기를 기다리고 있는 상태에서 보류 중인 Pod보다 우선순위가 높은 Pod를 예약해야 하는 경우, 스케줄러는 우선순위가 더 높은 Pod를 대신 예약할 수 있습니다. 이러한 경우 스케줄러는 보류 중인 Pod의 nominatedNodeName
을 지워 해당 Pod를 다른 노드에 사용할 수 있도록 합니다.
선점을 수행해도 우선순위가 낮은 Pod가 노드에서 모두 제거되는 것은 아닙니다. 스케줄러는 우선순위가 낮은 Pod의 일부를 제거하여 보류 중인 Pod를 예약할 수 있습니다.
스케줄러는 노드에서 보류 중인 Pod를 예약할 수 있는 경우에만 해당 노드에서 Pod 선점을 고려합니다.
16.6.3.1. Pod 선점 및 기타 스케줄러 설정
Pod 우선순위 및 선점 기능을 활성화하는 경우 다른 스케줄러 설정을 고려하십시오.
- Pod 우선순위 및 Pod 중단 예산
- Pod 중단 예산은 동시에 작동해야 하는 최소 복제본 수 또는 백분율을 지정합니다. Pod 중단 예산을 지정하면 Pod를 최적의 노력 수준에서 선점할 때 OpenShift Container Platform에서 해당 예산을 준수합니다. 스케줄러는 Pod 중단 예산을 위반하지 않고 Pod를 선점하려고 합니다. 이러한 Pod를 찾을 수 없는 경우 Pod 중단 예산 요구 사항과 관계없이 우선순위가 낮은 Pod를 선점할 수 있습니다.
- Pod 우선순위 및 Pod 유사성
- Pod 유사성을 위해서는 동일한 라벨이 있는 다른 Pod와 같은 노드에서 새 Pod를 예약해야 합니다.
노드에서 우선순위가 낮은 하나 이상의 Pod와 보류 중인 Pod에 Pod 간 유사성이 있는 경우 스케줄러는 선호도 요구 사항을 위반하지 않고 우선순위가 낮은 Pod를 선점할 수 없습니다. 이 경우 스케줄러는 보류 중인 Pod를 예약할 다른 노드를 찾습니다. 그러나 스케줄러에서 적절한 노드를 찾을 수 있다는 보장이 없고 보류 중인 Pod가 예약되지 않을 수 있습니다.
이러한 상황을 방지하려면 우선순위가 같은 Pod를 사용하여 Pod 유사성을 신중하게 구성합니다.
16.6.3.2. 선점된 Pod의 정상 종료
Pod를 선점할 때 스케줄러는 Pod의 정상 종료 기간이 만료될 때까지 대기하여 Pod가 작동을 완료하고 종료할 수 있습니다. 기간이 지난 후에도 Pod가 종료되지 않으면 스케줄러에서 Pod를 종료합니다. 이러한 정상 종료 기간으로 인해 스케줄러에서 Pod를 선점하는 시점과 노드에서 보류 중인 Pod를 예약할 수 있는 시간 사이에 시차가 발생합니다.
이 간격을 최소화하려면 우선순위가 낮은 Pod의 정상 종료 기간을 짧게 구성하십시오.
16.6.4. Pod 우선순위 예제 시나리오
Pod 우선순위 및 선점은 예약하기 위해 Pod에 우선순위를 할당합니다. 스케줄러는 우선순위가 높은 Pod를 예약하기 위해 우선순위가 낮은 Pod를 선점(evict)합니다.
- 일반적인 선점 시나리오
포드 P 는 보류 중인 포드입니다.
- 스케줄러는 하나 이상의 Pod를 제거하면 해당 노드에서 Pod P 를 예약할 수 있는 노드 N 을 찾습니다.
- 스케줄러는 우선순위가 낮은 Pod를 Node N 에서 삭제하고 노드의 Pod P 를 예약합니다.
-
Pod P 의
nominatedNodeName
필드가 Node N 의 이름으로 설정됩니다.
Pod P 가 지정된 노드에 반드시 예약되어 있지 않습니다.
- 선점 및 종료 기간
선점된 Pod의 종료 기간은 길어집니다.
- 스케줄러는 노드 N 에서 우선순위가 낮은 Pod를 선점합니다.
- 스케줄러는 Pod가 정상적으로 종료될 때까지 기다립니다.
- 다른 스케줄링상의 이유로 노드 M 을 사용할 수 있게 됩니다.
- 그런 다음 스케줄러는 노드 M 에서 Pod P 를 예약할 수 있습니다.
16.6.5. 우선순위 및 선점 구성
우선순위 클래스 오브젝트를 생성하고 Pod 사양에서 priority ClassName을 사용하여 Pod를 우선순위에 연결하여 우선순위
및 선점을 적용합니다.
우선순위 클래스 오브젝트 샘플
apiVersion: scheduling.k8s.io/v1beta1 kind: PriorityClass metadata: name: high-priority 1 value: 1000000 2 globalDefault: false 3 description: "This priority class should be used for XYZ service pods only." 4
- 1
- 우선순위 클래스 오브젝트의 이름입니다.
- 2
- 오브젝트의 우선순위 값입니다.
- 3
- 우선순위 클래스 이름이 지정되지 않은 Pod에 이 우선순위 클래스를 사용해야 하는지의 여부를 나타내는 선택적 필드입니다. 이 필드는 기본적으로
false
입니다.globalDefault
가true
로 설정된 하나의 우선순위 클래스만 클러스터에 존재할 수 있습니다.globalDefault:true
가 설정된 우선순위 클래스가 없는 경우 우선순위 클래스 이름이 없는 Pod의 우선순위는 0입니다.globalDefault:true
를 사용하여 우선순위 클래스를 추가하면 우선순위 클래스를 추가한 후 생성된 Pod에만 영향을 미치고 기존 Pod의 우선순위는 변경되지 않습니다. - 4
- 개발자가 이 우선순위 클래스와 함께 사용해야 하는 Pod를 설명하는 임의의 텍스트 문자열(선택 사항)입니다.
우선순위 클래스 이름이 있는 샘플 Pod 사양
apiVersion: v1
kind: Pod
metadata:
name: nginx
labels:
env: test
spec:
containers:
- name: nginx
image: nginx
imagePullPolicy: IfNotPresent
priorityClassName: high-priority 1
- 1
- 이 Pod에 사용할 우선순위 클래스를 지정합니다.
우선순위 및 선점을 사용하도록 클러스터를 구성하려면 다음을 수행합니다.
우선순위 클래스를 한 개 이상 생성합니다.
- 우선순위의 이름과 값을 지정합니다.
-
필요한 경우 우선순위 클래스 및 설명에
globalDefault
필드를 지정합니다.
- Pod를 생성하거나 기존 Pod를 편집하여 우선순위 클래스의 이름을 포함합니다. Pod 구성 또는 Pod 템플릿에 우선순위 이름을 직접 추가할 수 있습니다.
16.6.6. 우선순위 및 선점 비활성화
Pod 우선순위 및 선점 기능을 비활성화할 수 있습니다.
기능이 비활성화되면 기존 Pod는 우선순위 필드를 유지하지만 선점은 비활성화되고 우선순위 필드는 무시됩니다. 기능이 비활성화되면 새 Pod에 우선순위 클래스 이름을 설정할 수 없습니다.
중요한 Pod는 클러스터가 리소스 부족 상태에 있을 때 스케줄러 선점을 사용합니다. 이러한 이유로 선점을 비활성화하지 않는 것이 좋습니다. DaemonSet Pod는 DaemonSet 컨트롤러에서 예약하며 선점을 비활성화하여 영향을 받지 않습니다.
클러스터의 선점을 비활성화하려면 다음을 수행합니다.
master-config.yaml
을 수정하여schedulerArgs
섹션에서disablePreemption
매개변수를false로 설정합니다
.disablePreemption=false
OpenShift Container Platform 마스터 서비스 및 스케줄러를 다시 시작하여 변경 사항을 적용합니다.
# master-restart api # master-restart scheduler
16.7. 고급 예약
16.7.1. 개요
고급 예약에는 Pod가 특정 노드에서 실행되거나 특정 노드에서 실행되도록 Pod를 구성해야 합니다.
OpenShift Container Platform에서 적절한 방식으로 Pod를 자동으로 배치하므로 일반적으로 고급 예약은 필요하지 않습니다. 예를 들어 기본 스케줄러는 노드에 Pod를 균등하게 배포하고 노드에서 사용 가능한 리소스를 고려합니다. 그러나 포드가 배치되는 위치를 추가로 제어할 수 있습니다.
Pod가 더 빠른 디스크 속도로 머신에 있어야 하거나 해당 시스템에 배치되지 않거나 Pod를 통신할 수 있도록 두 가지 서비스의 포드를 배치해야 하는 경우 고급 예약을 사용하여 이러한 작업을 수행할 수 있습니다.
적절한 새 Pod가 전용 노드 그룹에 예약되고 다른 새 Pod가 해당 노드에 예약되지 않도록 하려면 필요에 따라 이러한 방법을 결합할 수 있습니다.
16.7.2. 고급 스케줄링 사용
클러스터에서 고급 예약을 호출하는 방법에는 여러 가지가 있습니다.
- Pod 유사성 및 유사성 방지
Pod 유사성을 사용하면 Pod 에서 Pod 그룹(애플리케이션의 대기 시간 요구 사항의 경우, 보안 등으로 인해)에 대한 선호도(또는 유사성 방지)를 사용하여 배치할 수 있습니다. 노드는 배치를 제어할 수 없습니다.
Pod 유사성은 Pod 배치에 대한 규칙을 생성하기 위해 Pod의 노드 및 라벨 선택기의 라벨을 사용합니다. 규칙은 필수(필수) 또는 best-effort(기본값)일 수 있습니다.
- 노드 유사성
노드 유사성을 사용하면 Pod 에서 노드 그룹(특별한 하드웨어, 위치, 고가용성에 대한 요구 사항)에 대해 선호도(또는 유사성 방지)를 지정할 수 있습니다. 노드는 배치를 제어할 수 없습니다.
노드 유사성은 Pod 배치에 대한 규칙을 생성하기 위해 Pod의 노드 및 라벨 선택기의 라벨을 사용합니다. 규칙은 필수(필수) 또는 best-effort(기본값)일 수 있습니다.
노드 유사성 사용을 참조하십시오.
- 노드 선택기
노드 선택기는 고급 스케줄링의 가장 간단한 형식입니다. 노드 유사성과 마찬가지로 노드 선택기는 노드 및 Pod의 라벨을 사용하여 Pod 에서 배치할 수 있는 노드를 제어할 수 있습니다. 그러나 노드 선택기에는 필수 규칙이 없으며 노드 선호도가 있는 기본 규칙이 있습니다.
- 테인트 및 허용 오차
테인트/Tolerations를 사용하면 노드에서 예약해야 하거나 예약해서는 안 되는 Pod 를 제어할 수 있습니다. 테인트는 노드의 레이블이며 허용 오차는 Pod의 라벨입니다. Pod의 라벨은 예약하기 위해 노드의 레이블(taint)과 일치(또는 허용)해야 합니다.
테인트/내선은 선호도보다 한 가지 장점이 있습니다. 예를 들어 다른 레이블이 있는 새 노드 그룹을 클러스터에 추가하는 경우 노드에 액세스하려는 각 Pod와 새 노드를 사용하지 않으려는 다른 Pod에서 유사성을 업데이트해야 합니다. 테인트/내역을 사용하면 다른 Pod가 다시 입력되기 때문에 해당 Pod가 해당 새 노드에 도착하는 데 필요한 해당 Pod만 업데이트하면 됩니다.
테인트 및 허용 오차 사용을 참조하십시오.
16.8. 고급 스케줄링 및 노드 유사성
16.8.1. 개요
노드 유사성 은 스케줄러에서 Pod를 배치할 수 있는 위치를 결정하는 데 사용하는 규칙 집합입니다. 규칙은 노드의 사용자 정의 라벨과 Pod에 지정된 라벨 선택기를 사용하여 정의됩니다. 노드 유사성을 사용하면 Pod 에서 배치할 수 있는 노드 그룹에 대한 선호도(또는 유사성 방지)를 지정할 수 있습니다. 노드는 배치를 제어할 수 없습니다.
예를 들어 특정 CPU 또는 특정 가용성 영역이 있는 노드에서만 실행하도록 Pod를 구성할 수 있습니다.
노드 유사성 규칙에는 필수 및 기본 두 가지의 유형이 있습니다.
노드에 Pod를 예약하려면 먼저 필수 규칙을 충족해야 합니다. 기본 규칙은 규칙이 충족되는 경우 스케줄러가 규칙을 적용하려고 하지만 반드시 적용되는 것은 아닙니다.
노드의 라벨이 런타임에 변경되어 Pod에 대한 노드 유사성 규칙이 더 이상 충족되지 않으면 Pod가 해당 노드에서 계속 실행됩니다.
16.8.2. 노드 유사성 구성
Pod 사양 파일을 통해 노드 유사성을 구성합니다. 필수 규칙, 기본 규칙 또는 둘 다 지정할 수 있습니다. 둘 다 지정하는 경우 노드는 먼저 필수 규칙을 충족한 다음 기본 규칙을 충족하려고 합니다.
다음 예제는 키가 e2e-az-NorthSouth이고 값이 e2e-az-
인 레이블이 있는 노드에 Pod를 배치해야 하는 규칙이 있는 Pod 사양입니다. North
또는 e2e-az-South
노드 유사성 필수 규칙이 있는 Pod 구성 파일 샘플
apiVersion: v1 kind: Pod metadata: name: with-node-affinity spec: affinity: nodeAffinity: 1 requiredDuringSchedulingIgnoredDuringExecution: 2 nodeSelectorTerms: - matchExpressions: - key: e2e-az-NorthSouth 3 operator: In 4 values: - e2e-az-North 5 - e2e-az-South 6 containers: - name: with-node-affinity image: docker.io/ocpqe/hello-pod
다음 예제는 Pod에 대해 키가 e2e-az-EastWest
이고 값이 e2e-az-East
또는 e2e-az-West
인 라벨이 있는 노드를 선호하는 기본 규칙이 있는 노드 사양입니다.
노드 유사성 기본 규칙이 있는 Pod 구성 파일 샘플
apiVersion: v1 kind: Pod metadata: name: with-node-affinity spec: affinity: nodeAffinity: 1 preferredDuringSchedulingIgnoredDuringExecution: 2 - weight: 1 3 preference: matchExpressions: - key: e2e-az-EastWest 4 operator: In 5 values: - e2e-az-East 6 - e2e-az-West 7 containers: - name: with-node-affinity image: docker.io/ocpqe/hello-pod
명시적인 노드 유사성 방지 개념은 없지만 NotIn
또는 DoesNotExist
연산자를 사용하여 해당 동작을 복제합니다.
동일한 Pod 구성에서 노드 유사성 및 노드 선택기를 사용하는 경우 다음을 확인합니다.
-
nodeSelector
와nodeAffinity
를 둘 다 구성하는 경우 Pod를 후보 노드에 예약하기 위해서는 두 상태를 모두 충족해야 합니다. -
nodeAffinity
유형과 연결된nodeSelectorTerms
를 여러 개 지정하는 경우nodeSelectorTerms
중 하나를 충족하면 Pod를 노드에 예약할 수 있습니다. -
nodeSelectorTerms
와 연결된matchExpressions
를 여러 개 지정하는 경우 모든matchExpressions
를 충족할 때만 Pod를 노드에 예약할 수 있습니다.
16.8.2.1. 필수 노드 유사성 규칙 구성
노드에 Pod를 예약하려면 먼저 필수 규칙을 충족해야 합니다.
다음 단계에서는 하나의 노드 및 스케줄러에서 해당 노드에 배치해야 하는 하나의 Pod를 생성하는 간단한 구성을 보여줍니다.
노드 구성을 편집하거나
oc label node 명령을 사용하여 노드에 레이블을 추가합니다
.$ oc label node node1 e2e-az-name=e2e-az1
참고클러스터에서 노드를 수정하려면 필요에 따라 노드 구성 맵을 업데이트합니다.
node-config.yaml
파일을 수동으로 편집하지 마십시오.Pod 사양에서
nodeAffinity 스탠자를
사용하여requiredDuringSchedulingIgnoredDuringExecution 매개변수를 구성합니다
.-
충족해야 하는 키와 값을 지정합니다. 편집한 노드에 새 Pod를 예약하려면 노드의 라벨과 동일한
key
및value
매개변수를 사용합니다. operator
를 지정합니다. 연산자는In
,NotIn
,Exists
,DoesNotExist
,Lt
또는Gt
일 수 있습니다. 예를 들어 노드에 라벨이 있어야 하는 경우 연산자In
을 사용합니다.spec: affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: e2e-az-name operator: In values: - e2e-az1 - e2e-az2
-
충족해야 하는 키와 값을 지정합니다. 편집한 노드에 새 Pod를 예약하려면 노드의 라벨과 동일한
Pod를 생성합니다.
$ oc create -f e2e-az2.yaml
16.8.2.2. Preferred 노드 유사성 규칙 구성
기본 규칙은 규칙이 충족되는 경우 스케줄러가 규칙을 적용하려고 하지만 반드시 적용되는 것은 아닙니다.
다음 단계에서는 하나의 노드 및 스케줄러에서 해당 노드에 배치하려고 하는 하나의 Pod를 생성하는 간단한 구성을 보여줍니다.
노드 구성을 편집하거나
oc label node 명령을 실행하여 노드에 레이블을 추가합니다
.$ oc label node node1 e2e-az-name=e2e-az3
참고클러스터에서 노드를 수정하려면 필요에 따라 노드 구성 맵을 업데이트합니다.
node-config.yaml
파일을 수동으로 편집하지 마십시오.Pod 사양에서
nodeAffinity 스탠자를
사용하여preferredDuringSchedulingIgnoredDuringExecution 매개변수를 구성합니다
.- 노드의 가중치를 숫자 1~100으로 지정합니다. 가중치가 높은 노드가 우선합니다.
충족해야 하는 키와 값을 지정합니다. 편집한 노드에 새 Pod를 예약하려면 노드의 라벨과 동일한
key
및value
매개변수를 사용합니다.preferredDuringSchedulingIgnoredDuringExecution: - weight: 1 preference: matchExpressions: - key: e2e-az-name operator: In values: - e2e-az3
-
operator
를 지정합니다. 연산자는In
,NotIn
,Exists
,DoesNotExist
,Lt
또는Gt
일 수 있습니다. 예를 들어 노드에 라벨이 있어야 하는 경우 연산자In
을 사용합니다. Pod를 생성합니다.
$ oc create -f e2e-az3.yaml
16.8.3. 예
다음 예제에서는 노드 유사성을 보여줍니다.
16.8.3.1. 일치하는 라벨을 사용한 노드 유사성
다음 예제에서는 일치하는 라벨이 있는 노드 및 Pod의 노드 유사성을 보여줍니다.
Node1 노드에는 라벨
zone:us
가 있습니다.$ oc label node node1 zone=us
Pod pod-s1 에는 필수 노드 유사성 규칙에 따라
zone
및us
키/값 쌍이 있습니다.$ cat pod-s1.yaml apiVersion: v1 kind: Pod metadata: name: pod-s1 spec: containers: - image: "docker.io/ocpqe/hello-pod" name: hello-pod affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: "zone" operator: In values: - us
표준 명령을 사용하여 Pod를 생성합니다.
$ oc create -f pod-s1.yaml pod "pod-s1" created
Pod pod-s1 은 Node1 에서 예약할 수 있습니다.
$ oc get pod -o wide NAME READY STATUS RESTARTS AGE IP NODE pod-s1 1/1 Running 0 4m IP1 node1
16.8.3.2. 일치하는 레이블이 없는 노드 유사성
다음 예제에서는 일치하는 라벨이 없는 노드 및 Pod의 노드 유사성을 보여줍니다.
Node1 노드에는 라벨
zone:emea
가 있습니다.$ oc label node node1 zone=emea
Pod pod-s1 에는 필수 노드 유사성 규칙에 따라
zone
및us
키/값 쌍이 있습니다.$ cat pod-s1.yaml apiVersion: v1 kind: Pod metadata: name: pod-s1 spec: containers: - image: "docker.io/ocpqe/hello-pod" name: hello-pod affinity: nodeAffinity: requiredDuringSchedulingIgnoredDuringExecution: nodeSelectorTerms: - matchExpressions: - key: "zone" operator: In values: - us
Pod pod-s1 은 Node1 에 예약할 수 없습니다.
$ oc describe pod pod-s1 ... Events: FirstSeen LastSeen Count From SubObjectPath Type Reason --------- -------- ----- ---- ------------- -------- ------ 1m 33s 8 default-scheduler Warning FailedScheduling No nodes are available that match all of the following predicates:: MatchNodeSelector (1).
16.9. 고급 스케줄링 및 Pod 유사성 및 유사성 방지
16.9.1. 개요
Pod 유사성 및 Pod 유사성 방지를 사용하면 다른 Pod와 관련하여 Pod를 배치해야 하는 방법에 대한 규칙을 지정할 수 있습니다. 규칙은 노드의 사용자 정의 라벨과 Pod에 지정된 라벨 선택기를 사용하여 정의됩니다. Pod 유사성/유사성 방지를 사용하면 Pod 에서 배치할 수 있는 Pod 그룹에 유사성(또는 유사성 방지)을 지정할 수 있습니다. 노드는 배치를 제어할 수 없습니다.
예를 들어 유사성 규칙을 사용하여 서비스 내에서 또는 다른 서비스의 Pod와 관련하여 Pod를 분배하거나 패키징할 수 있습니다. 유사성 방지 규칙을 사용하면 특정 서비스의 Pod가 첫 번째 서비스의 Pod 성능을 방해하는 것으로 알려진 다른 서비스의 Pod와 동일한 노드에 예약되지 않도록 할 수 있습니다. 또는 서비스의 Pod를 노드 또는 가용성 영역에 분배하여 관련 오류를 줄일 수 있습니다.
Pod 유사성/유사성 방지를 사용하면 다른 Pod의 라벨에 따라 Pod를 예약할 수 있는 노드를 제한할 수 있습니다. 레이블 은 키/값 쌍입니다.
- Pod 유사성을 사용하면 새 Pod의 라벨 선택기가 현재 Pod의 라벨과 일치하는 경우 다른 Pod와 동일한 노드에서 새 Pod를 찾도록 스케줄러에 지시할 수 있습니다.
- Pod 유사성 방지를 사용하면 새 Pod의 라벨 선택기가 현재 Pod의 라벨과 일치하는 경우 스케줄러에서 동일한 라벨을 사용하여 Pod와 동일한 노드에서 새 Pod를 찾지 않도록 할 수 있습니다.
Pod 유사성 규칙에는 필수 및 기본 두 가지의 유형이 있습니다.
노드에 Pod를 예약하려면 먼저 필수 규칙을 충족해야 합니다. 기본 규칙은 규칙이 충족되는 경우 스케줄러가 규칙을 적용하려고 하지만 반드시 적용되는 것은 아닙니다.
Pod 우선순위 및 선점 설정에 따라 선호도 요구 사항을 위반하지 않고 스케줄러에서 Pod에 적절한 노드를 찾지 못할 수 있습니다. 이 경우 Pod를 예약하지 못할 수 있습니다.
이러한 상황을 방지하려면 우선순위가 같은 Pod를 사용하여 Pod 유사성을 신중하게 구성합니다.
16.9.2. Pod 유사성 및 유사성 방지 구성
Pod 사양 파일을 통해 Pod 유사성/유사성 방지를 구성합니다. 필수 규칙, 기본 규칙 또는 둘 다 지정할 수 있습니다. 둘 다 지정하는 경우 노드는 먼저 필수 규칙을 충족한 다음 기본 규칙을 충족하려고 합니다.
다음 예는 Pod 유사성 및 유사성 방지용으로 구성된 Pod 사양을 보여줍니다.
이 예제에서 Pod 유사성 규칙은 노드에 이미 실행 중인 Pod가 한 개 이상 있고 키가 security
이고 값이 S1
인 라벨이 있는 경우에만 노드에 Pod를 예약할 수 있음을 나타냅니다. Pod 유사성 방지 규칙은 노드에서 이미 Pod를 실행 중이고 키가 security
이고 값이 S2
인 라벨이 있는 경우 Pod를 노드에 예약하지 않는 것을 선호함을 나타냅니다.
Pod 유사성이 포함된 샘플 Pod 구성 파일
apiVersion: v1 kind: Pod metadata: name: with-pod-affinity spec: affinity: podAffinity: 1 requiredDuringSchedulingIgnoredDuringExecution: 2 - labelSelector: matchExpressions: - key: security 3 operator: In 4 values: - S1 5 topologyKey: failure-domain.beta.kubernetes.io/zone containers: - name: with-pod-affinity image: docker.io/ocpqe/hello-pod
Pod 유사성 방지가 포함된 샘플 Pod 구성 파일
apiVersion: v1 kind: Pod metadata: name: with-pod-antiaffinity spec: affinity: podAntiAffinity: 1 preferredDuringSchedulingIgnoredDuringExecution: 2 - weight: 100 3 podAffinityTerm: labelSelector: matchExpressions: - key: security 4 operator: In 5 values: - S2 topologyKey: kubernetes.io/hostname containers: - name: with-pod-affinity image: docker.io/ocpqe/hello-pod
런타임 시 노드의 라벨이 변경되어 Pod의 유사성 규칙이 더 이상 충족되지 않는 경우 Pod가 노드에서 계속 실행됩니다.
16.9.2.1. 유사성 규칙 구성
다음 단계에서는 라벨이 있는 Pod 및 유사성을 사용하여 해당 Pod에 예약할 수 있는 Pod를 생성하는 간단한 2-Pod 구성을 보여줍니다.
Pod 사양에서 특정 라벨을 사용하여 Pod를 생성합니다.
$ cat team4.yaml apiVersion: v1 kind: Pod metadata: name: security-s1 labels: security: S1 spec: containers: - name: security-s1 image: docker.io/ocpqe/hello-pod
다른 Pod를 생성할 때 다음과 같이 Pod 사양을 편집합니다.
-
podAffinity
스탠자를 사용하여requiredDuringSchedulingIgnoredDuringExecution
매개변수 또는preferredDuringSchedulingIgnoredDuringExecution
매개변수를 구성합니다. 충족해야 하는 키와 값을 지정합니다. 새 Pod를 다른 Pod와 함께 예약하려면 첫 번째 Pod의 라벨과 동일한
key
및value
매개변수를 사용합니다.podAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: security operator: In values: - S1 topologyKey: failure-domain.beta.kubernetes.io/zone
-
operator
를 지정합니다. 연산자는In
,NotIn
,Exists
또는DoesNotExist
일 수 있습니다. 예를 들어 노드에 라벨이 있어야 하는 경우 연산자In
을 사용합니다. -
이러한 토폴로지 도메인을 나타내기 위해 사용하며 미리 채워져 있는 Kubernetes 라벨인
topologyKey
를 지정합니다.
-
Pod를 생성합니다.
$ oc create -f <pod-spec>.yaml
16.9.2.2. 유사성 방지 규칙 구성
다음 단계에서는 라벨이 있는 Pod 및 유사성 방지 기본 규칙을 사용하여 해당 Pod에 예약하지 않는 Pod를 생성하는 간단한 2-Pod 구성을 보여줍니다.
Pod 사양에서 특정 라벨을 사용하여 Pod를 생성합니다.
$ cat team4.yaml apiVersion: v1 kind: Pod metadata: name: security-s2 labels: security: S2 spec: containers: - name: security-s2 image: docker.io/ocpqe/hello-pod
- 다른 Pod를 생성할 때 Pod 사양을 편집하여 다음 매개변수를 설정합니다.
podAffinity
스탠자를 사용하여requiredDuringSchedulingIgnoredDuringExecution
매개변수 또는preferredDuringSchedulingIgnoredDuringExecution
매개변수를 구성합니다.- 노드의 가중치를 1~100으로 지정합니다. 가중치가 높은 노드가 우선합니다.
충족해야 하는 키와 값을 지정합니다. 새 Pod를 다른 Pod와 함께 예약하지 않으려면 첫 번째 Pod의 라벨과 동일한
key
및value
매개변수를 사용합니다.podAntiAffinity: preferredDuringSchedulingIgnoredDuringExecution: - weight: 100 podAffinityTerm: labelSelector: matchExpressions: - key: security operator: In values: - S2 topologyKey: kubernetes.io/hostname
- 기본 규칙의 경우 1~100의 가중치를 지정합니다.
-
operator
를 지정합니다. 연산자는In
,NotIn
,Exists
또는DoesNotExist
일 수 있습니다. 예를 들어 노드에 라벨이 있어야 하는 경우 연산자In
을 사용합니다.
-
이러한 토폴로지 도메인을 나타내기 위해 사용하며 미리 채워져 있는 Kubernetes 라벨인
topologyKey
를 지정합니다. Pod를 생성합니다.
$ oc create -f <pod-spec>.yaml
16.9.3. 예
다음 예제에서는 Pod 유사성 및 Pod 유사성 방지를 보여줍니다.
16.9.3.1. Pod 유사성
다음 예제에서는 일치하는 라벨 및 라벨 선택기가 있는 Pod의 Pod 유사성을 보여줍니다.
Pod team4에는 라벨
team:4
가 있습니다.$ cat team4.yaml apiVersion: v1 kind: Pod metadata: name: team4 labels: team: "4" spec: containers: - name: ocp image: docker.io/ocpqe/hello-pod
Pod team4a에는
podAffinity
아래에 라벨 선택기team:4
가 있습니다.$ cat pod-team4a.yaml apiVersion: v1 kind: Pod metadata: name: team4a spec: affinity: podAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: team operator: In values: - "4" topologyKey: kubernetes.io/hostname containers: - name: pod-affinity image: docker.io/ocpqe/hello-pod
- team4a Pod는 team4 Pod와 동일한 노드에 예약됩니다.
16.9.3.2. Pod 유사성 방지
다음 예제에서는 일치하는 라벨 및 라벨 선택기가 있는 Pod의 Pod 유사성 방지를 보여줍니다.
Pod pod-s1에는 라벨
security:s1
이 있습니다.$ cat pod-s1.yaml apiVersion: v1 kind: Pod metadata: name: pod-s1 labels: security: s1 spec: containers: - name: ocp image: docker.io/ocpqe/hello-pod
Pod pod-s2에는
podAntiAffinity
아래에 라벨 선택기security:s1
이 있습니다.$ cat pod-s2.yaml apiVersion: v1 kind: Pod metadata: name: pod-s2 spec: affinity: podAntiAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: security operator: In values: - s1 topologyKey: kubernetes.io/hostname containers: - name: pod-antiaffinity image: docker.io/ocpqe/hello-pod
-
Pod pod-s2는
pod-s1
과 동일한 노드에 예약할 수 없습니다.
16.9.3.3. 일치하는 라벨이 없는 Pod 유사성
다음 예제에서는 일치하는 라벨 및 라벨 선택기가 없는 Pod의 Pod 유사성을 보여줍니다.
Pod pod-s1에는 라벨
security:s1
이 있습니다.$ cat pod-s1.yaml apiVersion: v1 kind: Pod metadata: name: pod-s1 labels: security: s1 spec: containers: - name: ocp image: docker.io/ocpqe/hello-pod
Pod pod-s2에는 라벨 선택기
security:s2
가 있습니다.$ cat pod-s2.yaml apiVersion: v1 kind: Pod metadata: name: pod-s2 spec: affinity: podAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: security operator: In values: - s2 topologyKey: kubernetes.io/hostname containers: - name: pod-affinity image: docker.io/ocpqe/hello-pod
security:s2
라벨이 있는 Pod가 포함된 노드가 없는 경우 Pod pod-s2는 예약되지 않습니다. 해당 라벨이 있는 기타 Pod가 없는 경우 새 Pod는 보류 중인 상태로 유지됩니다.NAME READY STATUS RESTARTS AGE IP NODE pod-s2 0/1 Pending 0 32s <none>
16.10. 고급 스케줄링 및 노드 선택기
16.10.1. 개요
노드 선택기는 키-값 쌍으로 구성된 맵을 지정합니다. 규칙은 노드의 사용자 정의 라벨과 Pod에 지정된 선택기를 사용하여 정의됩니다.
Pod를 노드에서 실행하려면 Pod에 노드의 라벨로 표시된 키-값 쌍이 있어야 합니다.
16.10.2. 노드 선택기 구성
Pod 구성에서 nodeSelector
를 사용하여 Pod가 특정 라벨이 있는 노드에만 배치되도록 할 수 있습니다.
원하는 라벨(자세한 내용은 노드의 라벨 업데이트 참조 ) 및 환경에 설정된 노드 선택기 가 있는지 확인합니다.
예를 들어 Pod 구성에 원하는 라벨을 나타내는
nodeSelector
값이 포함되어 있는지 확인합니다.apiVersion: v1 kind: Pod spec: nodeSelector: <key>: <value> ...
마스터 구성 파일 /etc/origin/master/master-config.yaml 을 수정하여 pod 배치를 거부할 노드 호스트에 할당된 라벨을 사용하여
nodeSelectorLabelBlacklist
를admissionConfig
섹션에 추가합니다.... admissionConfig: pluginConfig: PodNodeConstraints: configuration: apiversion: v1 kind: PodNodeConstraintsConfig nodeSelectorLabelBlacklist: - kubernetes.io/hostname - <label> ...
변경 사항을 적용하려면 OpenShift Container Platform을 다시 시작하십시오.
# master-restart api # master-restart controllers
동일한 Pod 구성에서 노드 선택기 및 노드 유사성을 사용하는 경우 다음을 확인합니다.
-
nodeSelector
와nodeAffinity
를 둘 다 구성하는 경우 Pod를 후보 노드에 예약하기 위해서는 두 상태를 모두 충족해야 합니다. -
nodeAffinity
유형과 연결된nodeSelectorTerms
를 여러 개 지정하는 경우nodeSelectorTerms
중 하나를 충족하면 Pod를 노드에 예약할 수 있습니다. -
nodeSelectorTerms
와 연결된matchExpressions
를 여러 개 지정하는 경우 모든matchExpressions
를 충족할 때만 Pod를 노드에 예약할 수 있습니다.
16.11. 고급 스케줄링 및 테인트 및 허용 오차
16.11.1. 개요
테인트(Taints) 및 톨러레이션(Tolerations)을 통해 노드에서 예약해야 하는 Pod 를 제어할 수 있습니다.
16.11.2. 테인트 및 허용 오차
테인트를 사용하면 Pod에 일치하는 톨러레이션 이 없는 경우 노드가 Pod 예약을 거부할 수 있습니다.
노드 사양(NodeSpec)을 통해 노드에 테인트를 적용하고 Pod 사양(PodSpec
)을 통해Pod에 허용 오차를 적용합니다.
노드의 테인트는 해당 테인트를 허용하지 않는 모든 Pod를 거절하도록 노드에 지시합니다.
테인트 및 톨러레이션은 key, value 및 effect로 구성되어 있습니다. 연산자를 사용하면 이러한 매개 변수 중 하나를 비워 둘 수 있습니다.
매개변수 | 설명 | ||||||
---|---|---|---|---|---|---|---|
|
| ||||||
|
| ||||||
| 다음 명령 중 하나를 실행합니다.
| ||||||
|
|
톨러레이션은 테인트와 일치합니다.
operator
매개변수가Equal
로 설정된 경우:-
key
매개변수는 동일합니다. -
value
매개변수는 동일합니다. -
effect
매개변수는 동일합니다.
-
operator
매개변수가Exists
로 설정된 경우:-
key
매개변수는 동일합니다. -
effect
매개변수는 동일합니다.
-
16.11.2.1. 여러 테인트 사용
동일한 노드에 여러 테인트를 배치하고 동일한 pod에 여러 톨러레이션을 배치할 수 있습니다. OpenShift Container Platform은 다음과 같이 여러 테인트 및 톨러레이션을 처리합니다.
- Pod에 일치하는 톨러레이션이 있는 테인트를 처리합니다.
나머지 일치하지 테인트는 pod에서 다음 effect를 갖습니다.
-
effect가
NoSchedule
인 일치하지 않는 테인트가 하나 이상있는 경우 OpenShift Container Platform은 해당 노드에 pod를 예약할 수 없습니다. -
effect가
NoSchedule
인 일치하지 않는 테인트가 없지만 effect가PreferNoSchedule
인 일치하지 않는 테인트가 하나 이상있는 경우, OpenShift 컨테이너 플랫폼은 노드에 pod를 예약 시도하지 않습니다. effect가
NoExecute
인 일치하지 않는 테인트가 하나 이상있는 경우 OpenShift Container Platform은 노드에서 Pod를 제거하거나 (노드에서 이미 실행중인 경우) Pod가 노드에 예약되지 않습니다 (노드에서 아직 실행되지 않은 경우).- 테인트를 허용하지 Pod는 즉시 제거됩니다.
-
톨러레이션 사양에
tolerationSeconds
를 지정하지 않은 테인트를 허용하는 Pod는 영구적으로 바인딩된 상태로 유지됩니다. -
tolerationSeconds
가 지정된 테인트를 허용하는 Pod는 지정된 시간 동안 바인딩된 상태로 유지됩니다.
-
effect가
예를 들면 다음과 같습니다.
노드에는 다음과 같은 테인트가 있습니다.
$ oc adm taint nodes node1 key1=value1:NoSchedule $ oc adm taint nodes node1 key1=value1:NoExecute $ oc adm taint nodes node1 key2=value2:NoSchedule
Pod에는 다음과 같은 톨러레이션이 있습니다.
tolerations: - key: "key1" operator: "Equal" value: "value1" effect: "NoSchedule" - key: "key1" operator: "Equal" value: "value1" effect: "NoExecute"
이 경우 세 번째 테인트와 일치하는 톨러레이션이 없기 때문에 pod를 노드에 예약할 수 없습니다. 세 번째 테인트는 pod에서 허용되지 않는 세 번째 테인트 중 하나이기 때문에 테인트가 추가될 때 노드에서 이미 실행되고 있는 경우 pod가 계속 실행됩니다.
16.11.3. 기존 노드에 테인트 추가
테인트 및 허용 오차 구성 요소 테이블에 설명된 매개변수와 함께 oc adm taint
명령을 사용하여 노드에 테인트 를 추가합니다.
$ oc adm taint nodes <node-name> <key>=<value>:<effect>
예를 들면 다음과 같습니다.
$ oc adm taint nodes node1 key1=value1:NoExecute
이 예제에서는 키가 key
.
1, 값
에 taint를 배치합니다value1
이고 테인트 효과 NoExecute가 있는 node
1
16.11.4. Pod에 허용 오차 추가
Pod에 허용 오차를 추가하려면 tolerations
섹션을 포함하도록 Pod 사양을 편집합니다.
Equal
연산자가 있는 Pod 구성 파일의 예
tolerations: - key: "key1" 1 operator: "Equal" 2 value: "value1" 3 effect: "NoExecute" 4 tolerationSeconds: 3600 5
- 1 2 3 4
- 테인트 및 허용 오차 구성 요소 테이블에 설명된 허용 오차 매개변수입니다.
- 5
tolerationSeconds
매개변수를 지정하여 pod가 제거되기 전까지 노드에 바인딩되는 시간을 설정합니다. 아래에서 허용 초를 사용하여 Pod 제거를 지연하는 것을 참조하십시오.
Exists
연산자가 있는 pod 구성 파일의 예
tolerations: - key: "key1" operator: "Exists" effect: "NoExecute" tolerationSeconds: 3600
이러한 톨러레이션은 위의 oc adm taint 명령으로 생성된 테인트
와 일치합니다. 톨러레이션이 있는 pod는 node1
에 스케줄링할 수 있습니다.
16.11.4.1. 허용 오차를 사용하여 Pod 제거 지연
Pod 사양에 tolerationSeconds
매개변수를 지정하여 Pod가 제거되기 전에 노드에 바인딩되는 시간을 지정할 수 있습니다. NoExecute 효과가
있는 테인트가 노드에 추가되면 테인트를 허용하지 않는 모든 Pod가 즉시 제거됩니다(Taint를 허용하는 Pod는 제거되지 않음). 그러나 제거할 Pod에 tolerationSeconds
매개변수가 있는 경우 해당 기간이 만료될 때까지 Pod가 제거되지 않습니다.
예를 들면 다음과 같습니다.
tolerations: - key: "key1" operator: "Equal" value: "value1" effect: "NoExecute" tolerationSeconds: 3600
여기에서이 pod가 실행 중이지만 일치하는 테인트가 없는 경우 pod는 3,600 초 동안 노드에 바인딩된 후 제거됩니다. 이 시간 이전에 테인트가 제거되면 pod가 제거되지 않습니다.
16.11.4.1.1. 허용 오차 초의 기본값 설정
이 플러그인은 5분 동안 node.kubernetes. io/not-ready:NoExecute 및
테인트를 허용하도록 Pod의 기본 허용 허용 오차를 설정합니다.
node.kubernetes.io/unreachable:NoExecute
사용자가 제공하는 Pod 구성에 허용 오차가 이미 있는 경우 기본값은 추가되지 않습니다.
기본 허용 오차를 활성화하려면 다음을 수행합니다.
마스터 구성 파일(/etc/origin/master/master-config.yaml)을 admissionConfig 섹션에
DefaultTolerationSeconds
추가로 수정합니다.admissionConfig: pluginConfig: DefaultTolerationSeconds: configuration: kind: DefaultAdmissionConfig apiVersion: v1 disable: false
변경 사항을 적용하려면 OpenShift를 다시 시작하십시오.
# master-restart api # master-restart controllers
기본값이 추가되었는지 확인합니다.
Pod를 생성합니다.
$ oc create -f </path/to/file>
예를 들면 다음과 같습니다.
$ oc create -f hello-pod.yaml pod "hello-pod" created
Pod 허용 오차를 확인합니다.
$ oc describe pod <pod-name> |grep -i toleration
예를 들면 다음과 같습니다.
$ oc describe pod hello-pod |grep -i toleration Tolerations: node.kubernetes.io/not-ready=:Exists:NoExecute for 300s
16.11.5. 노드 문제 제거
OpenShift Container Platform은 노드에 연결할 수 없으며 노드 가 준비되지 않은 상태를 테인트로 표시하도록 구성할 수 있습니다. 이를 통해 기본값인 5분을 사용하는 대신 연결할 수 없거나 준비되지 않은 노드에 바인딩된 상태로 유지되는 시간을 포드당 사양으로 지정할 수 있습니다.
Taint Based Evictions 기능이 활성화되면 노드 컨트롤러에 의해 테인트가 자동으로 추가되고 Ready
노드에서 Pod를 제거하기 위한 일반 논리가 비활성화됩니다.
-
노드가 준비되지 않은 상태가 되면
node.kubernetes.io/not-ready:NoExecute
테인트가 추가되고 Pod를 노드에서 예약할 수 없습니다. 기존 Pod는 허용 오차 기간 동안 유지됩니다. -
노드가 연결할 수 없는 상태가 되면
node.kubernetes.io/unreachable:NoExecute
테인트가 추가되고 Pod를 노드에 예약할 수 없습니다. 기존 Pod는 허용 오차 기간 동안 유지됩니다.
테인트 기반 제거를 활성화하려면 다음을 수행합니다.
마스터 구성 파일(/etc/origin/master/master-config.yaml)을 수정하여
kubernetesMasterConfig
섹션에 다음을 추가합니다.kubernetesMasterConfig: controllerArguments: feature-gates: - TaintBasedEvictions=true
테인트가 노드에 추가되었는지 확인합니다.
$ oc describe node $node | grep -i taint Taints: node.kubernetes.io/not-ready:NoExecute
변경 사항을 적용하려면 OpenShift를 다시 시작하십시오.
# master-restart api # master-restart controllers
Pod에 허용 오차를 추가합니다.
tolerations: - key: "node.kubernetes.io/unreachable" operator: "Exists" effect: "NoExecute" tolerationSeconds: 6000
또는
tolerations: - key: "node.kubernetes.io/not-ready" operator: "Exists" effect: "NoExecute" tolerationSeconds: 6000
노드 문제로 인해 Pod 제거의 기존 속도 제한 동작을 유지 관리하기 위해 시스템은 속도가 제한된 방식으로 테인트를 추가합니다. 이렇게 하면 마스터가 노드에서 분할되는 등의 시나리오에서 대규모 Pod 제거가 방지됩니다.
16.11.6. DaemonSet 및 허용 오차
DaemonSet Pod는 node.kubernetes.io/unreachable 및
에 대한 node.kubernetes.io/
not-readyNoExecute
허용 오차 및 node.kubernetes.io/not-ready로 생성되어 Default Toleration Seconds 기능이 비활성화된 경우에도 DaemonSet
Pod가 제거되지 않도록 합니다.
16.11.7. 예
테인트 및 허용 오차는 노드에서 Pod를 제어하거나 노드에서 실행되지 않아야 하는 Pod를 제거하는 유연한 방법입니다. 일반적인 몇 가지 조사는 다음과 같습니다.
16.11.7.1. 사용자를 위한 노드 지정
특정 사용자 그룹이 독점적으로 사용할 노드 그룹을 지정할 수 있습니다.
전용 노드를 지정하려면 다음을 수행합니다.
해당 노드에 테인트를 추가합니다.
예를 들면 다음과 같습니다.
$ oc adm taint nodes node1 dedicated=groupName:NoSchedule
사용자 정의 승인 컨트롤러를 작성하여 Pod에 해당 톨러레이션을 추가합니다 .
톨러레이션이 있는 pod만 전용 노드를 사용할 수 있습니다.
16.11.7.2. 사용자를 노드에 바인딩
특정 사용자가 전용 노드만 사용할 수 있도록 노드를 구성할 수 있습니다.
사용자가 해당 노드 만 사용할 수 있도록 노드를 구성하려면 다음을 수행합니다.
해당 노드에 테인트를 추가합니다.
예를 들면 다음과 같습니다.
$ oc adm taint nodes node1 dedicated=groupName:NoSchedule
사용자 정의 승인 컨트롤러를 작성하여 Pod에 해당 톨러레이션을 추가합니다 .
승인 컨트롤러는 pod가
key:value
레이블 (dedicated=groupName
)로 레이블이 지정된 노드에만 예약할 수 있도록 노드 선호도를 추가해야 합니다.-
전용 노드에 테인트와 유사한 레이블 (예:
key:value
레이블)을 추가합니다.
16.11.7.3. 특수 하드웨어가 있는 노드
노드의 작은 하위 집합이 특수 하드웨어 (예: GPU)가 있는 클러스터에서 테인트 및 톨러레이션을 사용하여 특수 하드웨어가 필요하지 않은 Pod를 해당 노드에서 분리하여 특수 하드웨어가 필요한 Pod에 대한 노드를 유지할 수 있습니다. 또한 특정 노드를 사용하기 위해 특수 하드웨어가 필요한 Pod를 요청할 수도 있습니다.
특수 하드웨어에서 Pod를 차단하려면 다음을 수행합니다.
다음 명령 중 하나를 사용하여 특수 하드웨어가 있는 노드에 테인트를 설정합니다.
$ oc adm taint nodes <node-name> disktype=ssd:NoSchedule $ oc adm taint nodes <node-name> disktype=ssd:PreferNoSchedule
- 승인 컨트롤러를 사용하여 특수 하드웨어를 사용하는 Pod에 해당 톨러레이션을 추가합니다 .
예를 들어, 승인 컨트롤러는 톨러레이션을 추가하여 Pod의 일부 특성을 사용하고 Pod가 특수 노드를 사용할 수 있는지 여부를 확인할 수 있습니다.
Pod가 특수 하드웨어만 사용할 수 있도록하려면 추가 메커니즘이 필요합니다. 예를 들어, 특수 하드웨어가 있는 노드에 레이블을 지정하고 하드웨어가 필요한 Pod에서 노드 선호도를 사용할 수 있습니다.
17장. 할당량 설정
17.1. 개요
ResourceQuota
오브젝트에서 정의하는 리소스 할당량은 프로젝트당 집계 리소스 사용을 제한하는 제약 조건을 제공합니다. 프로젝트에서 생성할 수 있는 오브젝트의 수량을 유형별로 제한할 수 있으며 해당 프로젝트의 리소스에서 사용할 수 있는 컴퓨팅 리소스 및 스토리지의 총량도 제한할 수 있습니다.
컴퓨팅 리소스에 대한 자세한 내용은 개발자 가이드를 참조하십시오.
17.2. Quota에서 관리하는 리소스
다음은 할당량으로 관리할 수 있는 컴퓨팅 리소스 및 오브젝트 유형 집합을 설명합니다.
status.phase in (Failed, Succeeded)
이 True인 경우 Pod는 터미널 상태에 있습니다.
리소스 이름 | 설명 |
---|---|
|
터미널이 아닌 상태에서 모든 Pod의 CPU 요청 합계는 이 값을 초과할 수 없습니다. |
|
터미널이 아닌 상태에서 모든 Pod의 메모리 요청 합계는 이 값을 초과할 수 없습니다. |
|
터미널이 아닌 상태에서 모든 Pod의 로컬 임시 스토리지 요청 합계는 이 값을 초과할 수 없습니다. |
|
터미널이 아닌 상태에서 모든 Pod의 CPU 요청 합계는 이 값을 초과할 수 없습니다. |
|
터미널이 아닌 상태에서 모든 Pod의 메모리 요청 합계는 이 값을 초과할 수 없습니다. |
|
터미널이 아닌 상태에서 모든 Pod의 임시 스토리지 요청 합계는 이 값을 초과할 수 없습니다. |
| 터미널이 아닌 상태에서 모든 Pod의 CPU 제한 합계는 이 값을 초과할 수 없습니다. |
| 터미널이 아닌 상태에서 모든 Pod의 메모리 제한 합계는 이 값을 초과할 수 없습니다. |
| 터미널이 아닌 상태에서 모든 Pod의 임시 스토리지 제한 합계는 이 값을 초과할 수 없습니다. 이 리소스는 임시 스토리지 기술 프리뷰를 활성화한 경우에만 사용할 수 있습니다. 이 기능은 기본적으로 비활성화되어 있습니다. |
리소스 이름 | 설명 |
---|---|
| 상태와 관계없이 모든 영구 볼륨 클레임의 스토리지 요청 합계는 이 값을 초과할 수 없습니다. |
| 프로젝트에 존재할 수 있는 총 영구 볼륨 클레임 수입니다. |
| 상태와 관계없이 일치하는 스토리지 클래스가 있는 모든 영구 볼륨 클레임의 스토리지 요청 합계는 이 값을 초과할 수 없습니다. |
| 프로젝트에 존재할 수 있는, 일치하는 스토리지 클래스가 있는 총 영구 볼륨 클레임 수입니다. |
리소스 이름 | 설명 |
---|---|
| 프로젝트에 존재할 수 있는 터미널이 아닌 상태의 총 Pod 수입니다. |
| 프로젝트에 존재할 수 있는 총 복제 컨트롤러 수입니다. |
| 프로젝트에 존재할 수 있는 총 리소스 할당량 수입니다. |
| 프로젝트에 존재할 수 있는 총 서비스 수입니다. |
| 프로젝트에 존재할 수 있는 총 시크릿 수입니다. |
|
프로젝트에 존재할 수 있는 총 |
| 프로젝트에 존재할 수 있는 총 영구 볼륨 클레임 수입니다. |
| 프로젝트에 존재할 수 있는 총 이미지 스트림 수입니다. |
할당량을 생성하는 동안 count/<resource>.<group>
구문을 사용하여 이러한 표준 네임스페이스 리소스 유형에 대한 오브젝트 수 할당량을 구성할 수 있습니다.
$ oc create quota <name> --hard=count/<resource>.<group>=<quota> 1
- 1
<resource>
는 리소스 이름이고<group>
은 API 그룹입니다(해당하는 경우). 리소스 및 관련 API 그룹 목록에kubectl api-resources
명령을 사용합니다.