第6章 DSPA コンポーネントエラーのトラブルシューティング


この表には、DataSciencePipelinesApplication (DSPA) コンポーネントで見つかった一般的なエラーと、そのステータス、メッセージ、および提案された解決策が表示されます。Ready 条件タイプは、さまざまな DSPA コンポーネントからのエラーを蓄積し、DSPA デプロイメントのステータスビューを提供します。

Expand
ステータスエラーメッセージと解決策

ObjectStorageAvailable

Ready

False

False

エラーメッセージ: Could not connect to Object Store: tls: failed to verify certificate: x509: certificate signed by unknown authority

解決策: この問題は、OpenShift AI バージョン 2.9 以降で自己署名証明書を使用するクラスターで発生します。データサイエンスパイプラインマネージャーは、オブジェクトストレージ SSL 証明書を信頼していないため、オブジェクトストレージに接続できません。したがって、パイプラインサーバーを作成できません。関連する認証局バンドルを追加するには、IT 運用管理者に問い合わせてください。

詳細は、証明書の使用 を参照してください。

ObjectStorageAvailable

Ready

False

False

エラーメッセージ: Could not connect to Object Store Deployment for component "ds-pipeline-pipelines-definition" is missing - prerequisite component might not yet be available.Deployment for component "ds-pipeline-persistenceagent-pipelines-definition" is missing - prerequisite component might not yet be available.Deployment for component "ds-pipeline-scheduledworkflow-pipelines-definition" is missing - prerequisite component might not yet be available.

解決策: OpenShift AI 2.8.x を実行しているクラスターでは、データサイエンスパイプラインマネージャーがオブジェクトストレージへの接続に失敗し、パイプラインサーバーが作成されない可能性があります。

オブジェクトストアの認証情報と接続情報が正確であることを確認し、データサイエンスプロジェクトに関連付けられた OpenShift namespace 内からオブジェクトストアにアクセスできることを確認します。よくある問題の 1 つとして、特に自己署名証明書が使用されている場合に、オブジェクトストレージ SSL 証明書が信頼されないことが挙げられます。

オブジェクトストレージの認証情報を確認して更新し、操作を再試行してください。

ObjectStorageAvailable

Ready

False

False

エラーメッセージ:Wrong credentials for Object Storage: Could not connect to (minio-my-project.apps.my-cluster.com), Error: The request signature we calculated does not match the signature you provided.Check your key and signing method.

解決策: オブジェクトストレージの正しい認証情報を指定して、操作を再試行してください。

DatabaseAvailable

Ready

False

False

エラーメッセージ: FailingToDeploy: Dial tcp XXX.XX.XXX.XXX:3306 : i/o timeout

解決策: 起動後も問題が解決しない場合は、ネットワークの問題やデータベース接続設定の誤った設定がないか確認してください。

DatabaseAvailable

Ready

False

False

エラーメッセージ: Unable to connect to external database: tls: failed to verify certificate: x509: certificate signed by unknown authority

解決策: この問題は、Amazon RDS などの外部データベースを使用する場合に発生する可能性があります。データサイエンスパイプラインマネージャーは、データベース SSL 証明書を信頼していないためデータベースに接続できず、パイプラインサーバーの作成が妨げられます。関連する証明書を追加するには、IT 運用管理者に問い合わせてください。

詳細は、証明書の使用 を参照してください。

DatabaseAvailable

Ready

False

False

エラーメッセージ: Error 1129: Host 'A.B.C.D' is blocked because of many connection errors.

解決策: この問題は、Amazon RDS などの外部データベースを使用しているときに発生する可能性があります。最初に、パイプラインサーバーが正常に作成されます。ただし、しばらくすると、OpenShift AI ダッシュボードに "Error displaying pipelines" というメッセージが表示され、DSPA 条件では、複数の接続エラーが原因でホストがブロックされていることが示されます。

外部 Amazon RDS データベースでこの問題を解決する方法の詳細は、Resolving "Host is blocked because of many connection errors" error in Amazon RDS for MySQL を参照してください。

APIServerReady

Ready

False

False

エラーメッセージ: Route creation failed due to lengthy project name: Route.route.openshift.io is invalid: spec.host exceeds 63 characters.

解決策: OpenShift のプロジェクト名が 40 文字未満であることを確認します。

APIServerReady

Ready

False

False

エラーメッセージ: FailingToDeploy: Component replica failed to create.Message: serviceaccount "ds-pipeline-sample" not found.

解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。

PersistenceAgentReady

Ready

False

False

エラーメッセージ: FailingToDeploy: Component's replica failed to create.Message: serviceaccount "ds-pipeline-persistenceagent-sample" not found.

解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。

ScheduledWorkflowReady

Ready

False

False

エラーメッセージ: FailingToDeploy: Component's replica failed to create.Message: serviceaccount "ds-pipeline-scheduledworkflow-sample" not found.

解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。

MLMDProxyReady

Ready

False

False

エラーメッセージ: Deploying: Component [ds-pipeline-scheduledworkflow-sample] is still deploying.

解決策: DSPA の起動が完了するまで待ちます。25 秒後にデプロイメントが失敗する場合は、ログで詳細情報を確認してください。

6.1. DSP コンポーネントに共通するエラー

次の表は、複数の DSPA コンポーネントで発生する可能性のあるエラーを示しています。

Expand
デプロイメントの状況と状況の種類ステータスエラーメッセージと解決策

状況: Component Deployment Not Found

状況の種類: ComponentDeploymentNotFound

False

エラーメッセージ: Deployment for component <component> is missing - prerequisite component might not yet be available.

解決策: コンポーネントのデプロイメントがありません。通常、これはデプロイメントの欠落または作成中に発生した問題が原因です。

状況: Deployment Scaled Down

条件タイプ: MinimumReplicasAvailable

False

エラーメッセージ: Deployment for component <component> is scaled down.

解決策: デプロイメントレプリカ数がゼロに設定されているため、コンポーネントは使用できません。

状況: Component Failing to Progress

状況の種類: FailingToDeploy

False

エラーメッセージ: Component <component> has failed to progress.Reason: <progressingCond.Reason>.Message: <progressingCond.Message>

解決策: ProgressDeadlineExceeded または ReplicaSetCreateError の問題などにより、デプロイメントが停止しました。

状況: Replica Creation Failure

状況の種類: FailingToDeploy

False

エラーメッセージ: Component's replica <component> has failed to create.Reason: <replicaFailureCond.Reason>.Message: <replicaFailureCond.Message>

解決策: レプリカの作成に失敗しました。通常はレプリカセットまたはサービスアカウントのエラーが原因です。

状況: Pod-Level Failures

状況の種類: FailingToDeploy

False

エラーメッセージ: Concatenated failure messages for each pod.

解決策: デプロイメント Pod が失敗した状態です。詳細は Pod ログを確認してください。

状況: Pod in CrashLoopBackOff

状況の種類: FailingToDeploy

False

エラーメッセージ: Component <component> is in CrashLoopBackOff.Message from pod: <crashLoopBackOffMessage>

解決策: Pod コンテナーは、環境変数が正しくないか、サービスアカウントが見つからないことが原因で、繰り返し失敗します。

状況: Component Deploying (No Errors)

状況: 種類: Deploying

False

エラーメッセージ: Component <component> is deploying.

解決策: コンポーネントのデプロイメントプロセスは進行中で、エラーは検出されません。

状況: Component Minimally Available

条件タイプ: MinimumReplicasAvailable

True

エラーメッセージ: Component <component> is minimally available.

解決策: コンポーネントは使用可能ですが、最小数のレプリカが実行されている場合にのみ使用可能です。

トップに戻る
Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2025 Red Hat