36.13. EFK 문제 해결
다음은 클러스터 로깅 배포에서 일반적으로 식별되는 여러 문제에 대한 정보를 해결합니다.
36.13.1. 모든 EFK 구성 요소와 관련된 문제 해결
일반적으로 다음과 같은 문제 해결 문제가 EFK 스택에 적용됩니다.
배포에 실패했습니다. 복제 컨트롤러가 0으로 스케일링되었습니다.
10분 시간 초과 전에 인스턴스를 가져오지 않는 배포를 수행하는 경우 OpenShift Container Platform에서는 배포가 실패로 간주되고 인스턴스 0개로 축소됩니다. oc get pods
명령은 0이 아닌 종료 코드가 있고 배포된 포드가 없는 배포자 포드를 표시합니다.
다음 예에서는 Elasticsearch 배포에 대한 배포자 Pod 이름이 표시됩니다. 이는 DeploymentConfig logging-es-2e7ut0iq의 배포인 ReplicationController
에서 가져온 것입니다.
logging-es-2e7ut0iq
-1
NAME READY STATUS RESTARTS AGE logging-es-2e7ut0iq-1-deploy 1/1 ExitCode:255 0 1m
배포 실패는 이미지 가져오기가 너무 오래 걸리거나 노드가 응답하지 않는 노드와 같은 여러 가지 이동상의 이유로 발생할 수 있습니다.
가능한 이유로 배포자 Pod 로그를 검사하거나 재배포를 시도합니다.
$ oc deploy --latest logging-es-2e7ut0iq
또는 기존 배포를 확장해 보십시오.
$ oc scale --replicas=1 logging-es-2e7ut0iq-1
문제가 계속되면 Pod, 이벤트 및 systemd 장치 로그를 검사하여 문제의 원인을 확인합니다.
kubernetes.default.svc.cluster.local을 확인할 수 없습니다
마스터의 이 내부 별칭은 마스터에 포함된 DNS 서버에서 확인할 수 있어야 합니다. 플랫폼에 따라 마스터에 대해 dig
명령(예: 컨테이너에서)을 실행하여 다음과 같은 경우인지 확인할 수 있습니다.
$ dig kubernetes.default.svc.cluster.local @localhost [...] ;; QUESTION SECTION: ;kubernetes.default.svc.cluster.local. IN A ;; ANSWER SECTION: kubernetes.default.svc.cluster.local. 30 IN A 172.30.0.1
이전 버전의 클러스터 로깅은 마스터의 이 내부 별칭을 자동으로 정의하지 않았습니다. 집계된 로깅을 사용하려면 클러스터를 업그레이드해야 할 수 있습니다. 클러스터가 최신 상태인 경우 마스터의 SkyDNS 확인자에 도달하는 Pod에 문제가 있거나 Pod가 실행 중이 차단되었을 수 있습니다. 다시 배포하기 전에 이 문제를 해결해야 합니다.
마스터 또는 서비스에 연결할 수 없습니다
DNS 확인이 전혀 반환되지 않거나 주소가 Pod 내에서(예: fluentd Pod) 연결할 수 없는 경우 시스템 방화벽/네트워크 문제가 있음을 나타낼 수 있습니다. 이 문제를 디버그해야 합니다.