6장. DSPA 구성 요소 오류 문제 해결
이 표에는 관련 상태, 메시지 및 제안된 솔루션과 함께 DataSciencePipelinesApplication(DSPA) 구성 요소에서 발견된 일반적인 오류가 표시됩니다. Ready 조건 유형은 다양한 DSPA 구성 요소의 오류를 누적하여 DSPA 배포에 대한 상태 보기를 제공합니다.
유형 | 상태 | 오류 메시지 및 솔루션 |
---|---|---|
Ready | False False |
오류 메시지: 해결 방법: 이 문제는 OpenShift AI 버전 2.9 이상에서 자체 서명된 인증서를 사용하는 클러스터에서 발생합니다. 데이터 사이언스 파이프라인 관리자는 오브젝트 스토리지 SSL 인증서를 신뢰하지 않기 때문에 오브젝트 스토리지에 연결할 수 없습니다. 따라서 파이프라인 서버를 생성할 수 없습니다. 관련 인증 기관 번들을 추가하려면 IT 운영 관리자에게 문의하십시오. 자세한 내용은 인증서 작업을 참조하십시오. |
Ready | False False |
오류 메시지: 솔루션: OpenShift AI 2.8.x를 실행하는 클러스터에서 데이터 사이언스 파이프라인 관리자가 오브젝트 스토리지에 연결하지 못할 수 있으며 파이프라인 서버가 생성되지 않을 수 있습니다. 오브젝트 저장소 자격 증명 및 연결 정보가 정확한지 확인하고 데이터 사이언스 프로젝트의 관련 OpenShift 네임 스페이스 내에서 오브젝트 저장소에 액세스할 수 있는지 확인합니다. 한 가지 일반적인 문제는 특히 자체 서명된 인증서가 사용되는 경우 오브젝트 스토리지 SSL 인증서를 신뢰할 수 없다는 것입니다. 오브젝트 스토리지 인증 정보를 확인하고 업데이트한 다음 작업을 다시 시도합니다. |
Ready | False False |
오류 메시지: 해결 방법: 오브젝트 스토리지에 올바른 인증 정보를 제공하고 작업을 다시 시도합니다. |
Ready | False False |
오류 메시지: 해결 방법: 문제가 시작 후에도 지속되는 경우 데이터베이스 연결 설정에서 네트워크 문제 또는 잘못된 구성을 확인하십시오. |
Ready | False False |
오류 메시지: 해결 방법: 이 문제는 Amazon RDS와 같은 외부 데이터베이스를 사용할 때 발생할 수 있습니다. 데이터 사이언스 파이프라인 관리자는 데이터베이스 SSL 인증서를 신뢰하지 않아 파이프라인 서버가 생성되지 않기 때문에 데이터베이스에 연결할 수 없습니다. 관련 인증서를 추가하려면 IT 운영 관리자에게 문의하십시오. 자세한 내용은 인증서 작업을 참조하십시오. |
Ready | False False |
오류 메시지: 해결 방법: 이 문제는 Amazon RDS와 같은 외부 데이터베이스를 사용할 때 발생할 수 있습니다. 처음에는 파이프라인 서버가 성공적으로 생성됩니다. 그러나 잠시 후 OpenShift AI 대시보드에는 "파이너를 표시하는 오류" 메시지가 표시되고 DSPA 상태는 여러 연결 오류로 인해 호스트가 차단되었음을 나타냅니다. 외부 Amazon RDS 데이터베이스에 대한 이 문제를 해결하는 방법에 대한 자세한 내용은 Amazon RDS for MySQL에서 "호스트가 많은 연결 오류로 인해 차단됨" 오류를 참조하십시오. 참고: 이 링크를 클릭하면 외부 웹사이트가 열립니다. |
Ready | False False |
오류 메시지: 해결 방법: OpenShift의 프로젝트 이름이 40자 미만인지 확인합니다. |
Ready | False False |
오류 메시지: 해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다. |
Ready | False False |
오류 메시지: 해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다. |
Ready | False False |
오류 메시지: 해결 방법: DSPA를 시작하는 동안 오류가 25초 이상 지속되면 누락된 서비스 계정을 다시 생성합니다. |
Ready | False False |
오류 메시지: 해결 방법: DSPA 시작이 완료될 때까지 기다립니다. 25초 후에 배포가 실패하면 로그에 추가 정보가 있는지 확인합니다. |
6.1. DSP 구성 요소의 일반적인 오류 링크 복사링크가 클립보드에 복사되었습니다!
다음 표에는 여러 DSPA 구성 요소에서 발생할 수 있는 오류가 나열되어 있습니다.
배포 조건 및 조건 유형 | 상태 | 오류 메시지 및 솔루션 |
---|---|---|
조건: 구성 요소 배포를 찾을 수 없음
조건 유형: | False |
오류 메시지: 구성 요소 < 해결 방법: 구성 요소에 대한 배포가 존재하지 않습니다. 일반적으로 이 문제는 배포가 누락되었거나 생성 중에 발생한 문제로 인해 발생합니다. |
조건: 배포 스케일 다운
조건 유형: | False |
오류 메시지: 구성 요소 < 해결 방법: 배포 복제본 수가 0으로 설정되므로 구성 요소를 사용할 수 없습니다. |
Condition: Component Failing to Progress
조건 유형: | False |
오류 메시지:
해결 방법: |
조건: 복제 생성 실패
조건 유형: | False |
오류 메시지: 해결 방법: 복제본 세트 또는 서비스 계정의 오류로 인해 복제가 실패했습니다. |
조건: Pod 수준 실패
조건 유형: | False |
오류 메시지: 해결 방법: 배포 Pod가 failed 상태입니다. 자세한 내용은 Pod 로그를 확인합니다. |
condition: CrashLoopBackOff의 Pod
조건 유형: | False |
오류 메시지: 해결 방법: 잘못된 환경 변수 또는 서비스 계정이 누락되어 Pod 컨테이너가 반복적으로 실패합니다. |
조건: 구성 요소 배포 (오류 없음)
조건: 유형: | False |
오류 메시지: component 해결 방법: 구성 요소 배포 프로세스가 감지된 오류 없이 진행 중입니다. |
조건: 최소 사용 가능 구성 요소
조건 유형: | True |
오류 메시지: 해결 방법: 구성 요소를 사용할 수 있지만 최소 복제본 수만 실행 중입니다. |