6장. DSPA 구성 요소 오류 문제 해결


이 표에는 관련 상태, 메시지 및 제안된 솔루션과 함께 DataSciencePipelinesApplication(DSPA) 구성 요소에서 발견된 일반적인 오류가 표시됩니다. Ready 조건 유형은 다양한 DSPA 구성 요소의 오류를 누적하여 DSPA 배포에 대한 상태 보기를 제공합니다.

Expand
유형상태오류 메시지 및 솔루션

ObjectStorageAvailable

Ready

False

False

오류 메시지: Object Store에 연결할 수 없음: tls: failed to verify certificate: x509: certificate signed by unknown authority

해결 방법: 이 문제는 OpenShift AI 버전 2.9 이상에서 자체 서명된 인증서를 사용하는 클러스터에서 발생합니다. 데이터 사이언스 파이프라인 관리자는 오브젝트 스토리지 SSL 인증서를 신뢰하지 않기 때문에 오브젝트 스토리지에 연결할 수 없습니다. 따라서 파이프라인 서버를 생성할 수 없습니다. 관련 인증 기관 번들을 추가하려면 IT 운영 관리자에게 문의하십시오.

자세한 내용은 인증서 작업을 참조하십시오.

ObjectStorageAvailable

Ready

False

False

오류 메시지: Could not connect to Object Store Deployment for component "ds-pipeline-pipelines-definition" - 사전 요구 사항 구성 요소를 아직 사용할 수 없을 수 있습니다. 구성 요소 "ds-pipeline-persistenceagent-pipelines-definition"에 대한 배포가 누락되어 사전 요구 사항 구성 요소를 아직 사용할 수 없을 수 있습니다. 구성 요소 "ds-pipeline-scheduledworkflow-pipelines-definition"에 대한 배포가 누락되어 사전 요구 사항 구성 요소를 아직 사용할 수 없을 수 있습니다.

솔루션: OpenShift AI 2.8.x를 실행하는 클러스터에서 데이터 사이언스 파이프라인 관리자가 오브젝트 스토리지에 연결하지 못할 수 있으며 파이프라인 서버가 생성되지 않을 수 있습니다.

오브젝트 저장소 자격 증명 및 연결 정보가 정확한지 확인하고 데이터 사이언스 프로젝트의 관련 OpenShift 네임 스페이스 내에서 오브젝트 저장소에 액세스할 수 있는지 확인합니다. 한 가지 일반적인 문제는 특히 자체 서명된 인증서가 사용되는 경우 오브젝트 스토리지 SSL 인증서를 신뢰할 수 없다는 것입니다.

오브젝트 스토리지 인증 정보를 확인하고 업데이트한 다음 작업을 다시 시도합니다.

ObjectStorageAvailable

Ready

False

False

오류 메시지: 오브젝트 스토리지에 대한 인증 정보: could not connect to (minio-my-project.apps.my-cluster.com), 오류: 계산한 요청 서명이 제공한 서명과 일치하지 않습니다. 키 및 서명 방법을 확인합니다.

해결 방법: 오브젝트 스토리지에 올바른 인증 정보를 제공하고 작업을 다시 시도합니다.

DatabaseAvailable

Ready

False

False

오류 메시지: FailingToDeploy: Dial tcp XXX.XX.XXX.XXX:3306 : i/o 시간 초과

해결 방법: 문제가 시작 후에도 지속되는 경우 데이터베이스 연결 설정에서 네트워크 문제 또는 잘못된 구성을 확인하십시오.

DatabaseAvailable

Ready

False

False

오류 메시지: 외부 데이터베이스에 연결할 수 없음: tls: failed to verify certificate: x509: certificate signed by unknown authority

해결 방법: 이 문제는 Amazon RDS와 같은 외부 데이터베이스를 사용할 때 발생할 수 있습니다. 데이터 사이언스 파이프라인 관리자는 데이터베이스 SSL 인증서를 신뢰하지 않아 파이프라인 서버가 생성되지 않기 때문에 데이터베이스에 연결할 수 없습니다. 관련 인증서를 추가하려면 IT 운영 관리자에게 문의하십시오.

자세한 내용은 인증서 작업을 참조하십시오.

DatabaseAvailable

Ready

False

False

오류 메시지: 오류 1129: 많은 연결 오류로 인해 호스트 'A.B.C.D'가 차단되었습니다.

해결 방법: 이 문제는 Amazon RDS와 같은 외부 데이터베이스를 사용할 때 발생할 수 있습니다. 처음에는 파이프라인 서버가 성공적으로 생성됩니다. 그러나 잠시 후 OpenShift AI 대시보드에는 "파이너를 표시하는 오류" 메시지가 표시되고 DSPA 상태는 여러 연결 오류로 인해 호스트가 차단되었음을 나타냅니다.

외부 Amazon RDS 데이터베이스에 대한 이 문제를 해결하는 방법에 대한 자세한 내용은 Amazon RDS for MySQL에서 "호스트가 많은 연결 오류로 인해 차단됨" 오류를 참조하십시오. 참고: 이 링크를 클릭하면 외부 웹사이트가 열립니다.

APIServerReady

Ready

False

False

오류 메시지: 긴 프로젝트 이름으로 인해 경로 생성이 실패했습니다. Route.route.openshift.io는 유효하지 않습니다. spec.host는 63자를 초과합니다.

해결 방법: OpenShift의 프로젝트 이름이 40자 미만인지 확인합니다.

APIServerReady

Ready

False

False

오류 메시지: FailingToDeploy: 구성 요소 복제본이 생성되지 않았습니다. message: serviceaccount "ds-pipeline-sample"을 찾을 수 없습니다.

해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다.

PersistenceAgentReady

Ready

False

False

오류 메시지: FailingToDeploy: 구성 요소의 복제본을 생성하지 못했습니다. message: serviceaccount "ds-pipeline-persistenceagent-sample"을 찾을 수 없습니다.

해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다.

ScheduledWorkflowReady

Ready

False

False

오류 메시지: FailingToDeploy: 구성 요소의 복제본을 생성하지 못했습니다. message: serviceaccount "ds-pipeline-scheduledworkflow-sample"을 찾을 수 없습니다.

해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다.

MLMDProxyReady

Ready

False

False

오류 메시지: Deploying: Component [ds-pipeline-scheduledworkflow-sample] is still deploying.

해결 방법: DSPA 시작이 완료될 때까지 기다립니다. 25초 후에 배포가 실패하면 로그에 추가 정보가 있는지 확인합니다.

6.1. DSP 구성 요소의 일반적인 오류

다음 표에는 여러 DSPA 구성 요소에서 발생할 수 있는 오류가 나열되어 있습니다.

Expand
배포 조건 및 조건 유형상태오류 메시지 및 솔루션

조건: 구성 요소 배포를 찾을 수 없음

조건 유형: ComponentDeploymentNotFound

False

오류 메시지: 구성 요소 < component>에 대한 배포가 누락되어 사전 요구 사항 구성 요소를 아직 사용할 수 없을 수 있습니다.

해결 방법: 구성 요소에 대한 배포가 존재하지 않습니다. 일반적으로 이 문제는 배포가 누락되었거나 생성 중에 발생한 문제로 인해 발생합니다.

조건: 배포 스케일 다운

조건 유형: MinimumReplicasAvailable

False

오류 메시지: 구성 요소 < component>에 대한 배포가 축소됩니다.

해결 방법: 배포 복제본 수가 0으로 설정되므로 구성 요소를 사용할 수 없습니다.

Condition: Component Failing to Progress

조건 유형: FailingToDeploy

False

오류 메시지: Component <component>가 진행되지 않았습니다. Reason: <progressingCond.Reason>. Message: <progressingCond.Message>

해결 방법: ProgressDeadlineExceeded 또는 ReplicaSetCreateError 문제로 인해 배포가 중단되었습니다.

조건: 복제 생성 실패

조건 유형: FailingToDeploy

False

오류 메시지: Component's replica <component> has failed to create. Reason: <replicaFailureCond.Reason>. Message: <replicaFailureCond.Message>

해결 방법: 복제본 세트 또는 서비스 계정의 오류로 인해 복제가 실패했습니다.

조건: Pod 수준 실패

조건 유형: FailingToDeploy

False

오류 메시지: 각 Pod에 대한 오류 메시지가 연결되었습니다.

해결 방법: 배포 Pod가 failed 상태입니다. 자세한 내용은 Pod 로그를 확인합니다.

condition: CrashLoopBackOff의 Pod

조건 유형: FailingToDeploy

False

오류 메시지: Component <component>는 CrashLoopBackOff에 있습니다. pod의 메시지: <crashLoopBackOffMessage>

해결 방법: 잘못된 환경 변수 또는 서비스 계정이 누락되어 Pod 컨테이너가 반복적으로 실패합니다.

조건: 구성 요소 배포 (오류 없음)

조건: 유형: 배포

False

오류 메시지: component <component>가 배포 중입니다.

해결 방법: 구성 요소 배포 프로세스가 감지된 오류 없이 진행 중입니다.

조건: 최소 사용 가능 구성 요소

조건 유형: MinimumReplicasAvailable

True

오류 메시지: Component <component>는 최소로 사용할 수 있습니다.

해결 방법: 구성 요소를 사용할 수 있지만 최소 복제본 수만 실행 중입니다.

맨 위로 이동
Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2025 Red Hat