홈
제품
OpenShift Container Platform
4.19
노드
6.6. BMC 자격 증명 없이 실패한 베어 메탈 제어 평면 노드 교체

6.6. BMC 자격 증명 없이 실패한 베어 메탈 제어 평면 노드 교체

베어 메탈 클러스터의 제어 평면 노드에 장애가 발생하여 복구할 수 없지만, 베이스보드 관리 컨트롤러(BMC) 자격 증명을 제공하지 않고 클러스터를 설치한 경우, 장애가 발생한 노드를 새 노드로 교체하기 위해 추가 단계를 수행해야 합니다.

6.6.1. 사전 요구 사항
링크 복사

건강에 해로운 베어 메탈 etcd 멤버를 식별했습니다.
시스템이 실행되고 있지 않거나 노드가 준비되지 않았음을 확인했습니다.
cluster-admin 역할의 사용자로 클러스터에 액세스할 수 있어야 합니다.
문제가 발생할 경우를 대비해 etcd 백업을 해두었습니다.
coreos-installer CLI를 다운로드하여 설치했습니다.
클러스터에 제어 평면 머신 세트가 없습니다. 다음 명령을 실행하여 머신셋을 확인할 수 있습니다.
```
oc get machinesets,controlplanemachinesets -n openshift-machine-api
```
```
$ oc get machinesets,controlplanemachinesets -n openshift-machine-api
```
Copy to Clipboard Toggle word wrap
중요
근로자를 위해 하나 이상의 기계 세트가 있어야 합니다. 제어 평면에 controlplanemachinesets가 있는 경우 이 절차를 사용하지 마세요.

6.6.2. 비정상적 etcd 멤버 제거
링크 복사

먼저 비정상적 etcd 멤버를 제거하여 실패한 제어 평면 노드를 제거합니다.

프로세스

다음 명령을 실행하여 etcd Pod를 나열하고 영향을 받는 노드에 없는 Pod를 기록해 둡니다.

oc -n openshift-etcd get pods -l k8s-app=etcd -o wide

$ oc -n openshift-etcd get pods -l k8s-app=etcd -o wide

Copy to Clipboard

Toggle word wrap

출력 예

etcd-openshift-control-plane-0   5/5   Running   11   3h56m   192.168.10.9    openshift-control-plane-0  <none>           <none>
etcd-openshift-control-plane-1   5/5   Running   0    3h54m   192.168.10.10   openshift-control-plane-1   <none>           <none>
etcd-openshift-control-plane-2   5/5   Running   0    3h58m   192.168.10.11   openshift-control-plane-2   <none>           <none>

etcd-openshift-control-plane-0   5/5   Running   11   3h56m   192.168.10.9    openshift-control-plane-0  <none>           <none>
etcd-openshift-control-plane-1   5/5   Running   0    3h54m   192.168.10.10   openshift-control-plane-1   <none>           <none>
etcd-openshift-control-plane-2   5/5   Running   0    3h58m   192.168.10.11   openshift-control-plane-2   <none>           <none>

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 실행 중인 etcd 컨테이너에 연결합니다.
```
oc rsh -n openshift-etcd <etcd_pod>
```
```
$ oc rsh -n openshift-etcd <etcd_pod>
```
Copy to Clipboard Toggle word wrap
<etcd_pod>를 정상 노드 중 하나와 연결된 etcd Pod의 이름으로 바꾸세요.
명령 예
```
oc rsh -n openshift-etcd etcd-openshift-control-plane-0
```
```
$ oc rsh -n openshift-etcd etcd-openshift-control-plane-0
```
Copy to Clipboard Toggle word wrap

다음 명령을 실행하여 etcd 멤버 목록을 확인하세요. 나중에 필요하므로, 해당 값이 잘못된 etcd 멤버의 ID와 이름을 기록해 두세요.

etcdctl member list -w table

sh-4.2# etcdctl member list -w table

Copy to Clipboard

Toggle word wrap

출력 예

+------------------+---------+------------------------------+---------------------------+---------------------------+
|        ID        | STATUS  |             NAME             |        PEER ADDRS         |       CLIENT ADDRS        |
+------------------+---------+------------------------------+---------------------------+---------------------------+
| 6fc1e7c9db35841d | started | openshift-control-plane-2    | https://10.0.131.183:2380 | https://10.0.131.183:2379 |
| 757b6793e2408b6c | started | openshift-control-plane-1    | https://10.0.164.97:2380  | https://10.0.164.97:2379  |
| ca8c2990a0aa29d1 | started | openshift-control-plane-0    | https://10.0.154.204:2380 | https://10.0.154.204:2379 |
+------------------+---------+------------------------------+---------------------------+---------------------------+

+------------------+---------+------------------------------+---------------------------+---------------------------+
|        ID        | STATUS  |             NAME             |        PEER ADDRS         |       CLIENT ADDRS        |
+------------------+---------+------------------------------+---------------------------+---------------------------+
| 6fc1e7c9db35841d | started | openshift-control-plane-2    | https://10.0.131.183:2380 | https://10.0.131.183:2379 |
| 757b6793e2408b6c | started | openshift-control-plane-1    | https://10.0.164.97:2380  | https://10.0.164.97:2379  |
| ca8c2990a0aa29d1 | started | openshift-control-plane-0    | https://10.0.154.204:2380 | https://10.0.154.204:2379 |
+------------------+---------+------------------------------+---------------------------+---------------------------+

Copy to Clipboard

Toggle word wrap

중요

etcdctl endpoint health 명령은 교체가 완료되고 새 멤버가 추가될 때까지 제거된 멤버를 나열합니다.

다음 명령을 실행하여 비정상적 etcd 멤버를 제거합니다.
```
etcdctl member remove <unhealthy_member_id>
```
```
sh-4.2# etcdctl member remove <unhealthy_member_id>
```
Copy to Clipboard Toggle word wrap
<unhealthy_member_id>를 비정상 노드의 etcd 멤버 ID로 바꿉니다.
명령 예
```
etcdctl member remove 6fc1e7c9db35841d
```
```
sh-4.2# etcdctl member remove 6fc1e7c9db35841d
```
Copy to Clipboard Toggle word wrap
출력 예
```
Member 6fc1e7c9db35841d removed from cluster b23536c33f2cdd1b
```
```
Member 6fc1e7c9db35841d removed from cluster b23536c33f2cdd1b
```
Copy to Clipboard Toggle word wrap

다음 명령을 실행하여 멤버 목록을 다시 보고 멤버가 제거되었는지 확인하세요.

etcdctl member list -w table

sh-4.2# etcdctl member list -w table

Copy to Clipboard

Toggle word wrap

출력 예

+------------------+---------+------------------------------+---------------------------+---------------------------+
|        ID        | STATUS  |             NAME             |        PEER ADDRS         |       CLIENT ADDRS        |
+------------------+---------+------------------------------+---------------------------+---------------------------+
| 757b6793e2408b6c | started | openshift-control-plane-1    | https://10.0.164.97:2380  | https://10.0.164.97:2379  |
| ca8c2990a0aa29d1 | started | openshift-control-plane-0    | https://10.0.154.204:2380 | https://10.0.154.204:2379 |
+------------------+---------+------------------------------+---------------------------+---------------------------+

+------------------+---------+------------------------------+---------------------------+---------------------------+
|        ID        | STATUS  |             NAME             |        PEER ADDRS         |       CLIENT ADDRS        |
+------------------+---------+------------------------------+---------------------------+---------------------------+
| 757b6793e2408b6c | started | openshift-control-plane-1    | https://10.0.164.97:2380  | https://10.0.164.97:2379  |
| ca8c2990a0aa29d1 | started | openshift-control-plane-0    | https://10.0.154.204:2380 | https://10.0.154.204:2379 |
+------------------+---------+------------------------------+---------------------------+---------------------------+

Copy to Clipboard

Toggle word wrap

중요

멤버를 제거한 후에는 나머지 etcd 인스턴스가 재부팅되는 동안 잠시 동안 클러스터에 접속할 수 없을 수 있습니다.

다음 명령을 실행하여 etcd Pod의 rsh 세션을 종료합니다.
```
exit
```
```
sh-4.2# exit
```
Copy to Clipboard Toggle word wrap

다음 명령을 실행하여 etcd 쿼럼 가드를 끕니다.

oc patch etcd/cluster --type=merge -p '{"spec": {"unsupportedConfigOverrides": {"useUnsupportedUnsafeNonHANonProductionUnstableEtcd": true}}}'

$ oc patch etcd/cluster --type=merge -p '{"spec": {"unsupportedConfigOverrides": {"useUnsupportedUnsafeNonHANonProductionUnstableEtcd": true}}}'

Copy to Clipboard

Toggle word wrap

이 명령을 사용하면 비밀을 성공적으로 다시 생성하고 정적 포드를 롤아웃할 수 있습니다.

다음 명령을 실행하여 제거된, 비정상적인 etcd 멤버에 대한 비밀을 나열합니다.

oc get secrets -n openshift-etcd | grep <node_name>

$ oc get secrets -n openshift-etcd | grep <node_name>

Copy to Clipboard

Toggle word wrap

<node_name>을 제거한 etcd 멤버의 실패한 노드 이름으로 바꾸세요.

명령 예

oc get secrets -n openshift-etcd | grep openshift-control-plane-2

$ oc get secrets -n openshift-etcd | grep openshift-control-plane-2

Copy to Clipboard

Toggle word wrap

출력 예

etcd-peer-openshift-control-plane-2             kubernetes.io/tls   2   134m
etcd-serving-metrics-openshift-control-plane-2  kubernetes.io/tls   2   134m
etcd-serving-openshift-control-plane-2          kubernetes.io/tls   2   134m

etcd-peer-openshift-control-plane-2             kubernetes.io/tls   2   134m
etcd-serving-metrics-openshift-control-plane-2  kubernetes.io/tls   2   134m
etcd-serving-openshift-control-plane-2          kubernetes.io/tls   2   134m

Copy to Clipboard

Toggle word wrap

제거된 영향을 받은 노드와 관련된 비밀을 삭제합니다.
1. 다음 명령을 실행하여 피어 비밀을 삭제합니다.
  $ oc delete secret -n openshift-etcd etcd-peer-<node_name>
  Copy to Clipboard Toggle word wrap
  <node_name>을 영향을 받는 노드의 이름으로 바꾸세요.
2. 다음 명령을 실행하여 제공 비밀을 삭제합니다.
  $ oc delete secret -n openshift-etcd etcd-serving-<node_name>
  Copy to Clipboard Toggle word wrap
  <node_name>을 영향을 받는 노드의 이름으로 바꾸세요.
3. 다음 명령을 실행하여 메트릭 비밀번호를 삭제합니다.
  $ oc delete secret -n openshift-etcd etcd-serving-metrics-<node_name>
  1
  Copy to Clipboard Toggle word wrap
  <node_name>을 영향을 받는 노드의 이름으로 바꾸세요.

6.6.3. 비정상 etcd 멤버의 머신 삭제
링크 복사

비정상적 etcd 멤버의 머신을 삭제하여 실패한 제어 평면 노드 제거를 완료합니다.

프로세스

다음 명령을 실행하여 Bare Metal Operator를 사용할 수 있는지 확인하세요.

oc get clusteroperator baremetal

$ oc get clusteroperator baremetal

Copy to Clipboard

Toggle word wrap

출력 예

NAME        VERSION   AVAILABLE   PROGRESSING   DEGRADED   SINCE   MESSAGE
baremetal   4.20.0    True        False         False      3d15h

NAME        VERSION   AVAILABLE   PROGRESSING   DEGRADED   SINCE   MESSAGE
baremetal   4.20.0    True        False         False      3d15h

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 영향을 받은 노드의 BareMetalHost 객체를 나중에 사용할 수 있도록 파일에 저장합니다.
```
oc get -n openshift-machine-api bmh <node_name> -o yaml > bmh_affected.yaml
```
```
$ oc get -n openshift-machine-api bmh <node_name> -o yaml > bmh_affected.yaml
```
Copy to Clipboard Toggle word wrap
<node_name>을 영향을 받는 노드의 이름으로 바꾸세요. 이 이름은 일반적으로 연관된 BareMetalHost 이름과 일치합니다.
다음 명령을 실행하여 저장된 BareMetalHost 개체의 YAML 파일을 보고 내용이 올바른지 확인하세요.
```
cat bmh_affected.yaml
```
```
$ cat bmh_affected.yaml
```
Copy to Clipboard Toggle word wrap
다음 명령을 실행하여 영향을 받은 BareMetalHost 객체를 제거합니다.
```
oc delete -n openshift-machine-api bmh <node_name>
```
```
$ oc delete -n openshift-machine-api bmh <node_name>
```
Copy to Clipboard Toggle word wrap
<node_name>을 영향을 받는 노드의 이름으로 바꾸세요.

다음 명령을 실행하여 모든 머신을 나열하고 영향을 받은 노드와 연결된 머신을 식별합니다.

oc get machines -n openshift-machine-api -o wide

$ oc get machines -n openshift-machine-api -o wide

Copy to Clipboard

Toggle word wrap

출력 예

NAME                            PHASE    TYPE  REGION  ZONE  AGE    NODE                       PROVIDERID                                                                                             STATE
examplecluster-control-plane-0  Running                      3h11m  openshift-control-plane-0  baremetalhost:///openshift-machine-api/openshift-control-plane-0/da1ebe11-3ff2-41c5-b099-0aa41222964e  externally provisioned
examplecluster-control-plane-1  Running                      3h11m  openshift-control-plane-1  baremetalhost:///openshift-machine-api/openshift-control-plane-1/d9f9acbc-329c-475e-8d81-03b20280a3e1  externally provisioned
examplecluster-control-plane-2  Running                      3h11m  openshift-control-plane-2  baremetalhost:///openshift-machine-api/openshift-control-plane-2/3354bdac-61d8-410f-be5b-6a395b056135  externally provisioned
examplecluster-compute-0        Running                      165m   openshift-compute-0        baremetalhost:///openshift-machine-api/openshift-compute-0/3d685b81-7410-4bb3-80ec-13a31858241f        provisioned
examplecluster-compute-1        Running                      165m   openshift-compute-1        baremetalhost:///openshift-machine-api/openshift-compute-1/0fdae6eb-2066-4241-91dc-e7ea72ab13b9        provisioned

NAME                            PHASE    TYPE  REGION  ZONE  AGE    NODE                       PROVIDERID                                                                                             STATE
examplecluster-control-plane-0  Running                      3h11m  openshift-control-plane-0  baremetalhost:///openshift-machine-api/openshift-control-plane-0/da1ebe11-3ff2-41c5-b099-0aa41222964e  externally provisioned
examplecluster-control-plane-1  Running                      3h11m  openshift-control-plane-1  baremetalhost:///openshift-machine-api/openshift-control-plane-1/d9f9acbc-329c-475e-8d81-03b20280a3e1  externally provisioned
examplecluster-control-plane-2  Running                      3h11m  openshift-control-plane-2  baremetalhost:///openshift-machine-api/openshift-control-plane-2/3354bdac-61d8-410f-be5b-6a395b056135  externally provisioned
examplecluster-compute-0        Running                      165m   openshift-compute-0        baremetalhost:///openshift-machine-api/openshift-compute-0/3d685b81-7410-4bb3-80ec-13a31858241f        provisioned
examplecluster-compute-1        Running                      165m   openshift-compute-1        baremetalhost:///openshift-machine-api/openshift-compute-1/0fdae6eb-2066-4241-91dc-e7ea72ab13b9        provisioned

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 비정상 멤버의 컴퓨터를 삭제합니다.
```
oc delete machine -n openshift-machine-api <machine_name>
```
```
$ oc delete machine -n openshift-machine-api <machine_name>
```
Copy to Clipboard Toggle word wrap
<machine_name>을 영향을 받는 노드와 연결된 머신 이름으로 바꾸세요.
명령 예
```
oc delete machine -n openshift-machine-api examplecluster-control-plane-2
```
```
$ oc delete machine -n openshift-machine-api examplecluster-control-plane-2
```
Copy to Clipboard Toggle word wrap
참고
BareMetalHost 및 Machine 객체를 제거하면 머신 컨트롤러가 자동으로 Node 객체를 삭제합니다.
어떤 이유로든 머신 삭제가 지연되거나 명령이 방해를 받아 지연되는 경우, 머신 객체 종료자 필드를 제거하여 강제로 삭제합니다.
주의
Ctrl+c 를 눌러 기계 삭제를 중단하지 마세요. 명령이 완료될 때까지 진행되도록 허용해야 합니다. 새 터미널 창을 열어 종료자 필드를 편집하고 삭제합니다.
1. 새 터미널 창에서 다음 명령을 실행하여 머신 구성을 편집합니다.
  $ oc edit machine -n openshift-machine-api examplecluster-control-plane-2
  Copy to Clipboard Toggle word wrap
2. 머신 사용자 지정 리소스에서 다음 필드를 삭제한 다음 업데이트된 파일을 저장합니다.
  finalizers: - machine.machine.openshift.io
  Copy to Clipboard Toggle word wrap
  출력 예
  machine.machine.openshift.io/examplecluster-control-plane-2 edited
  
  Copy to Clipboard Toggle word wrap

6.6.4. 실패한 노드가 삭제되었는지 확인
링크 복사

대체 제어 평면 노드를 생성하기 전에 실패한 노드가 성공적으로 삭제되었는지 확인하세요.

프로세스

다음 명령을 실행하여 머신이 삭제되었는지 확인하세요.

oc get machines -n openshift-machine-api -o wide

$ oc get machines -n openshift-machine-api -o wide

Copy to Clipboard

Toggle word wrap

출력 예

NAME                              PHASE     TYPE   REGION   ZONE   AGE     NODE                                 PROVIDERID                                                                                       STATE
examplecluster-control-plane-0    Running                          3h11m   openshift-control-plane-0   baremetalhost:///openshift-machine-api/openshift-control-plane-0/da1ebe11-3ff2-41c5-b099-0aa41222964e   externally provisioned
examplecluster-control-plane-1    Running                          3h11m   openshift-control-plane-1   baremetalhost:///openshift-machine-api/openshift-control-plane-1/d9f9acbc-329c-475e-8d81-03b20280a3e1   externally provisioned
examplecluster-compute-0          Running                          165m    openshift-compute-0         baremetalhost:///openshift-machine-api/openshift-compute-0/3d685b81-7410-4bb3-80ec-13a31858241f         provisioned
examplecluster-compute-1          Running                          165m    openshift-compute-1         baremetalhost:///openshift-machine-api/openshift-compute-1/0fdae6eb-2066-4241-91dc-e7ea72ab13b9         provisioned

NAME                              PHASE     TYPE   REGION   ZONE   AGE     NODE                                 PROVIDERID                                                                                       STATE
examplecluster-control-plane-0    Running                          3h11m   openshift-control-plane-0   baremetalhost:///openshift-machine-api/openshift-control-plane-0/da1ebe11-3ff2-41c5-b099-0aa41222964e   externally provisioned
examplecluster-control-plane-1    Running                          3h11m   openshift-control-plane-1   baremetalhost:///openshift-machine-api/openshift-control-plane-1/d9f9acbc-329c-475e-8d81-03b20280a3e1   externally provisioned
examplecluster-compute-0          Running                          165m    openshift-compute-0         baremetalhost:///openshift-machine-api/openshift-compute-0/3d685b81-7410-4bb3-80ec-13a31858241f         provisioned
examplecluster-compute-1          Running                          165m    openshift-compute-1         baremetalhost:///openshift-machine-api/openshift-compute-1/0fdae6eb-2066-4241-91dc-e7ea72ab13b9         provisioned

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 노드가 삭제되었는지 확인하세요.

oc get nodes

$ oc get nodes

Copy to Clipboard

Toggle word wrap

출력 예

NAME                     STATUS ROLES   AGE   VERSION
openshift-control-plane-0 Ready master 3h24m v1.33.4
openshift-control-plane-1 Ready master 3h24m v1.33.4
openshift-compute-0       Ready worker 176m v1.33.4
openshift-compute-1       Ready worker 176m v1.33.4

NAME                     STATUS ROLES   AGE   VERSION
openshift-control-plane-0 Ready master 3h24m v1.33.4
openshift-control-plane-1 Ready master 3h24m v1.33.4
openshift-compute-0       Ready worker 176m v1.33.4
openshift-compute-1       Ready worker 176m v1.33.4

Copy to Clipboard

Toggle word wrap

모든 클러스터 운영자가 변경 사항 롤아웃을 완료할 때까지 기다리세요. 다음 명령을 실행하여 진행 상황을 모니터링하세요.
```
watch oc get co
```
```
$ watch oc get co
```
Copy to Clipboard Toggle word wrap

에이전트 기반 설치 프로그램을 사용하여 클러스터를 설치한 경우 원래 클러스터 배포의 agent-config.yaml 파일에 있는 실패한 노드의 networkConfig 섹션을 새 제어 평면 노드의 Nmstate 파일의 시작점으로 사용할 수 있습니다. 예를 들어, 다음 명령은 첫 번째 제어 평면 노드에 대한 networkConfig 섹션을 추출합니다.

cat agent-config-iso.yaml | yq .hosts[0].networkConfig > new_controlplane_nmstate.yaml

$ cat agent-config-iso.yaml | yq .hosts[0].networkConfig > new_controlplane_nmstate.yaml

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 사용자 지정 Red Hat Enterprise Linux CoreOS(RHCOS) 라이브 ISO를 만듭니다.

coreos-installer iso customize rhcos-live.86_64.iso \
    --dest-ignition new_controlplane.ign \
    --network-nmstate new_controlplane_nmstate.yaml \
    --dest-device /dev/disk/by-path/<device_path> \
    -f

$ coreos-installer iso customize rhcos-live.86_64.iso \
    --dest-ignition new_controlplane.ign \
    --network-nmstate new_controlplane_nmstate.yaml \
    --dest-device /dev/disk/by-path/<device_path> \
    -f

Copy to Clipboard

Toggle word wrap

<device_path>를 ISO가 생성될 대상 장치의 경로로 바꾸세요.

사용자 정의된 RHCOS 라이브 ISO로 새로운 제어 평면 노드를 부팅합니다.
클러스터에 새 노드를 가입시키기 위해 인증서 서명 요청(CSR)을 승인합니다.

6.6.6. 노드, 베어 메탈 호스트 및 머신을 함께 연결합니다.
링크 복사

머신을 만든 다음 이를 새 BareMetalHost 개체 및 노드에 연결하여 새 제어 평면 노드를 계속 만듭니다.

프로세스

다음 명령을 실행하여 제어 평면 노드의 providerID를 가져옵니다.

oc get -n openshift-machine-api baremetalhost -l installer.openshift.io/role=control-plane -ojson | jq -r '.items[] | "baremetalhost:///openshift-machine-api/" + .metadata.name + "/" + .metadata.uid'

$ oc get -n openshift-machine-api baremetalhost -l installer.openshift.io/role=control-plane -ojson | jq -r '.items[] | "baremetalhost:///openshift-machine-api/" + .metadata.name + "/" + .metadata.uid'

Copy to Clipboard

Toggle word wrap

출력 예

baremetalhost:///openshift-machine-api/master-00/6214c5cf-c798-4168-8c78-1ff1a3cd2cb4
baremetalhost:///openshift-machine-api/master-01/58fb60bd-b2a6-4ff3-a88d-208c33abf954
baremetalhost:///openshift-machine-api/master-02/dc5a94f3-625b-43f6-ab5a-7cc4fc79f105

baremetalhost:///openshift-machine-api/master-00/6214c5cf-c798-4168-8c78-1ff1a3cd2cb4
baremetalhost:///openshift-machine-api/master-01/58fb60bd-b2a6-4ff3-a88d-208c33abf954
baremetalhost:///openshift-machine-api/master-02/dc5a94f3-625b-43f6-ab5a-7cc4fc79f105

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 레이블에 대한 클러스터 정보를 가져옵니다.

oc get machine -n openshift-machine-api \
    -l machine.openshift.io/cluster-api-machine-role=master \
    -L machine.openshift.io/cluster-api-cluster

$ oc get machine -n openshift-machine-api \
    -l machine.openshift.io/cluster-api-machine-role=master \
    -L machine.openshift.io/cluster-api-cluster

Copy to Clipboard

Toggle word wrap

출력 예

NAME                           PHASE   TYPE  REGION  ZONE  AGE  CLUSTER-API-CLUSTER
ci-op-jcp3s7wx-ng5sd-master-0  Running                     10h  ci-op-jcp3s7wx-ng5sd
ci-op-jcp3s7wx-ng5sd-master-1  Running                     10h  ci-op-jcp3s7wx-ng5sd
ci-op-jcp3s7wx-ng5sd-master-2  Running                     10h  ci-op-jcp3s7wx-ng5sd

NAME                           PHASE   TYPE  REGION  ZONE  AGE  CLUSTER-API-CLUSTER
ci-op-jcp3s7wx-ng5sd-master-0  Running                     10h  ci-op-jcp3s7wx-ng5sd
ci-op-jcp3s7wx-ng5sd-master-1  Running                     10h  ci-op-jcp3s7wx-ng5sd
ci-op-jcp3s7wx-ng5sd-master-2  Running                     10h  ci-op-jcp3s7wx-ng5sd

Copy to Clipboard

Toggle word wrap

다음과 유사한 yaml 파일을 만들어 새 제어 평면 노드에 대한 Machine 객체를 만듭니다.

apiVersion: machine.openshift.io/v1beta1
kind: Machine
metadata:
  annotations:
    metal3.io/BareMetalHost: openshift-machine-api/<new_control_plane_machine> 
  finalizers:
    - machine.machine.openshift.io
  labels:
    machine.openshift.io/cluster-api-cluster: <cluster_api_cluster> 
    machine.openshift.io/cluster-api-machine-role: master
    machine.openshift.io/cluster-api-machine-type: master
  name: <new_control_plane_machine> 
  namespace: openshift-machine-api
spec:
  metadata: {}
  providerID: <provider_id> 
  providerSpec:
    value:
      apiVersion: baremetal.cluster.k8s.io/v1alpha1
      hostSelector: {}
      image:
        checksum: ""
        url: ""
      kind: BareMetalMachineProviderSpec
      userData:
        name: master-user-data-managed

apiVersion: machine.openshift.io/v1beta1
kind: Machine
metadata:
  annotations:
    metal3.io/BareMetalHost: openshift-machine-api/<new_control_plane_machine>


  finalizers:
    - machine.machine.openshift.io
  labels:
    machine.openshift.io/cluster-api-cluster: <cluster_api_cluster>


    machine.openshift.io/cluster-api-machine-role: master
    machine.openshift.io/cluster-api-machine-type: master
  name: <new_control_plane_machine>


  namespace: openshift-machine-api
spec:
  metadata: {}
  providerID: <provider_id>


  providerSpec:
    value:
      apiVersion: baremetal.cluster.k8s.io/v1alpha1
      hostSelector: {}
      image:
        checksum: ""
        url: ""
      kind: BareMetalMachineProviderSpec
      userData:
        name: master-user-data-managed

Copy to Clipboard

Toggle word wrap

다음과 같습니다.

<new_control_plane_machine>: 이전에 삭제한 컴퓨터 이름과 동일할 수 있는 새 컴퓨터의 이름을 지정합니다.
<cluster_api_cluster>: 이전 단계의 출력에 표시된 다른 제어 평면 머신에 대한 CLUSTER-API-CLUSTER 값을 지정합니다.
<provider_id>: 이전 단계의 출력에 표시된 새로운 베어 메탈 호스트의 providerID 값을 지정합니다.

다음 경고가 예상됩니다.

Warning: metadata.finalizers: "machine.machine.openshift.io": prefer a domain-qualified finalizer name to avoid accidental conflicts with other finalizer writers

Warning: metadata.finalizers: "machine.machine.openshift.io": prefer a domain-qualified finalizer name to avoid accidental conflicts with other finalizer writers

Copy to Clipboard

Toggle word wrap

다음 단계를 단일 bash 셸 세션에서 수행하여 새 제어 평면 노드와 Machine 객체를 BareMetalHost 객체에 연결합니다.

다음 명령을 실행하여 NEW_NODE_NAME 변수를 정의합니다.
```
NEW_NODE_NAME=<new_node_name>
```
```
$ NEW_NODE_NAME=<new_node_name>
```
Copy to Clipboard Toggle word wrap
<new_node_name>을 새 제어 평면 노드의 이름으로 바꿉니다.
다음 명령을 실행하여 NEW_MACHINE_NAME 변수를 정의합니다.
```
NEW_MACHINE_NAME=<new_machine_name>
```
```
$ NEW_MACHINE_NAME=<new_machine_name>
```
Copy to Clipboard Toggle word wrap
<new_machine_name>을 새 머신의 이름으로 바꾸세요.

다음 명령을 실행하여 새 노드의 BareMetalHost 개체에서 BMH_UID를 추출하여 정의합니다.

BMH_UID=$(oc get -n openshift-machine-api bmh $NEW_NODE_NAME -ojson | jq -r .metadata.uid)

$ BMH_UID=$(oc get -n openshift-machine-api bmh $NEW_NODE_NAME -ojson | jq -r .metadata.uid)

Copy to Clipboard

Toggle word wrap

echo $BMH_UID

$ echo $BMH_UID

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 베어 메탈 호스트에 consumerRef 객체를 패치합니다.

oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --type merge --patch '{"spec":{"consumerRef":{"apiVersion":"machine.openshift.io/v1beta1","kind":"Machine","name":"'$NEW_MACHINE_NAME'","namespace":"openshift-machine-api"}}}'

$ oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --type merge --patch '{"spec":{"consumerRef":{"apiVersion":"machine.openshift.io/v1beta1","kind":"Machine","name":"'$NEW_MACHINE_NAME'","namespace":"openshift-machine-api"}}}'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 providerID 값을 새 노드에 패치합니다.

oc patch node $NEW_NODE_NAME --type merge --patch '{"spec":{"providerID":"baremetalhost:///openshift-machine-api/'$NEW_NODE_NAME'/'$BMH_UID'"}}'

$ oc patch node $NEW_NODE_NAME --type merge --patch '{"spec":{"providerID":"baremetalhost:///openshift-machine-api/'$NEW_NODE_NAME'/'$BMH_UID'"}}'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 providerID 값을 검토하세요.

oc get node -l node-role.kubernetes.io/control-plane -ojson | jq -r '.items[] | .metadata.name + "  " + .spec.providerID'

$ oc get node -l node-role.kubernetes.io/control-plane -ojson | jq -r '.items[] | .metadata.name + "  " + .spec.providerID'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 BareMetalHost 개체의 poweredOn 상태를 true 로 설정합니다.

oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --subresource status --type json -p '[{"op":"replace","path":"/status/poweredOn","value":true}]'

$ oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --subresource status --type json -p '[{"op":"replace","path":"/status/poweredOn","value":true}]'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 BareMetalHost 개체의 poweredOn 상태를 검토합니다.

oc get bmh -n openshift-machine-api -ojson | jq -r '.items[] | .metadata.name + "   PoweredOn:" +  (.status.poweredOn | tostring)'

$ oc get bmh -n openshift-machine-api -ojson | jq -r '.items[] | .metadata.name + "   PoweredOn:" +  (.status.poweredOn | tostring)'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 BareMetalHost 개체의 프로비저닝 상태를 검토합니다.

oc get bmh -n openshift-machine-api -ojson | jq -r '.items[] | .metadata.name + "   ProvisioningState:" +  .status.provisioning.state'

$ oc get bmh -n openshift-machine-api -ojson | jq -r '.items[] | .metadata.name + "   ProvisioningState:" +  .status.provisioning.state'

Copy to Clipboard

Toggle word wrap

중요

프로비저닝 상태가 관리되지 않음이 아닌 경우 다음 명령을 실행하여 프로비저닝 상태를 변경합니다.

oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --subresource status --type json -p '[{"op":"replace","path":"/status/provisioning/state","value":"unmanaged"}]'

$ oc patch -n openshift-machine-api bmh $NEW_NODE_NAME --subresource status --type json -p '[{"op":"replace","path":"/status/provisioning/state","value":"unmanaged"}]'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 머신 상태를 Provisioned 로 설정합니다.

oc patch -n openshift-machine-api machines $NEW_MACHINE_NAME -n openshift-machine-api --subresource status --type json -p '[{"op":"replace","path":"/status/phase","value":"Provisioned"}]'

$ oc patch -n openshift-machine-api machines $NEW_MACHINE_NAME -n openshift-machine-api --subresource status --type json -p '[{"op":"replace","path":"/status/phase","value":"Provisioned"}]'

Copy to Clipboard

Toggle word wrap

6.6.7. 새로운 etcd 멤버 추가
링크 복사

클러스터에 새로운 etcd 멤버를 추가하여 새로운 제어 평면 노드 추가를 완료합니다.

프로세스

다음 단계를 단일 bash 셸 세션에서 수행하여 클러스터에 새로운 etcd 멤버를 추가합니다.
1. 다음 명령을 실행하여 새 제어 평면 노드의 IP를 찾으세요.
  $ oc get nodes -owide -l node-role.kubernetes.io/control-plane
  Copy to Clipboard Toggle word wrap
  나중에 사용할 수 있도록 노드의 IP 주소를 기록해 두세요.
2. 다음 명령을 실행하여 etcd 포드를 나열합니다.
  $ oc get -n openshift-etcd pods -l k8s-app=etcd -o wide
  Copy to Clipboard Toggle word wrap
3. 다음 명령을 실행하여 실행 중인 etcd 포드 중 하나에 연결합니다. 새 노드의 etcd Pod는 CrashLoopBackOff 상태여야 합니다.
  $ oc rsh -n openshift-etcd <running_pod>
  Copy to Clipboard Toggle word wrap
  <running_pod>를 이전 단계에서 표시된 실행 중인 Pod의 이름으로 바꾸세요.
4. 다음 명령을 실행하여 etcd 멤버 목록을 확인하세요.
  sh-4.2# etcdctl member list -w table
  Copy to Clipboard Toggle word wrap
5. 다음 명령을 실행하여 새로운 제어 평면 etcd 멤버를 추가합니다.
  sh-4.2# etcdctl member add <new_node> --peer-urls="https://<ip_address>:2380"
  Copy to Clipboard Toggle word wrap
  다음과 같습니다.
  <new_node>
  새 제어 평면 노드의 이름을 지정합니다.
  <ip_address>
  새 노드의 IP 주소를 지정합니다.
6. 다음 명령을 실행하여 rsh 셸을 종료합니다.
  sh-4.2# exit
  Copy to Clipboard Toggle word wrap

다음 명령을 실행하여 etcd 재배포를 강제로 실행합니다.

oc patch etcd cluster -p='{"spec": {"forceRedeploymentReason": "single-master-recovery-'"$( date --rfc-3339=ns )"'"}}' --type=merge

$ oc patch etcd cluster -p='{"spec": {"forceRedeploymentReason": "single-master-recovery-'"$( date --rfc-3339=ns )"'"}}' --type=merge

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 etcd 쿼럼 가드를 다시 켭니다.

oc patch etcd/cluster --type=merge -p '{"spec": {"unsupportedConfigOverrides": null}}'

$ oc patch etcd/cluster --type=merge -p '{"spec": {"unsupportedConfigOverrides": null}}'

Copy to Clipboard

Toggle word wrap

다음 명령을 실행하여 클러스터 운영자 롤아웃을 모니터링합니다.
```
watch oc get co
```
```
$ watch oc get co
```
Copy to Clipboard Toggle word wrap

6.6. BMC 자격 증명 없이 실패한 베어 메탈 제어 평면 노드 교체

6.6.1. 사전 요구 사항
링크 복사

6.6.2. 비정상적 etcd 멤버 제거
링크 복사

6.6.3. 비정상 etcd 멤버의 머신 삭제
링크 복사

6.6.4. 실패한 노드가 삭제되었는지 확인
링크 복사

6.6.5. 새로운 제어 평면 노드 생성
링크 복사

6.6.6. 노드, 베어 메탈 호스트 및 머신을 함께 연결합니다.
링크 복사

6.6.7. 새로운 etcd 멤버 추가
링크 복사

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 소개

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

6.6. BMC 자격 증명 없이 실패한 베어 메탈 제어 평면 노드 교체

6.6.1. 사전 요구 사항링크 복사링크가 클립보드에 복사되었습니다!

6.6.2. 비정상적 etcd 멤버 제거링크 복사링크가 클립보드에 복사되었습니다!

6.6.3. 비정상 etcd 멤버의 머신 삭제링크 복사링크가 클립보드에 복사되었습니다!

6.6.4. 실패한 노드가 삭제되었는지 확인링크 복사링크가 클립보드에 복사되었습니다!

6.6.5. 새로운 제어 평면 노드 생성링크 복사링크가 클립보드에 복사되었습니다!

6.6.6. 노드, 베어 메탈 호스트 및 머신을 함께 연결합니다.링크 복사링크가 클립보드에 복사되었습니다!

6.6.7. 새로운 etcd 멤버 추가링크 복사링크가 클립보드에 복사되었습니다!

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat 소개

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

6.6.1. 사전 요구 사항
링크 복사

6.6.2. 비정상적 etcd 멤버 제거
링크 복사

6.6.3. 비정상 etcd 멤버의 머신 삭제
링크 복사

6.6.4. 실패한 노드가 삭제되었는지 확인
링크 복사

6.6.5. 새로운 제어 평면 노드 생성
링크 복사

6.6.6. 노드, 베어 메탈 호스트 및 머신을 함께 연결합니다.
링크 복사

6.6.7. 새로운 etcd 멤버 추가
링크 복사