第6章 DSPA コンポーネントエラーのトラブルシューティング
この表には、DataSciencePipelinesApplication (DSPA) コンポーネントで見つかった一般的なエラーと、そのステータス、メッセージ、および提案された解決策が表示されます。Ready 条件タイプは、さまざまな DSPA コンポーネントからのエラーを蓄積し、DSPA デプロイメントのステータスビューを提供します。
型 | ステータス | エラーメッセージと解決策 |
---|---|---|
Ready | False False |
エラーメッセージ: 解決策: この問題は、OpenShift AI バージョン 2.9 以降で自己署名証明書を使用するクラスターで発生します。データサイエンスパイプラインマネージャーは、オブジェクトストレージ SSL 証明書を信頼していないため、オブジェクトストレージに接続できません。したがって、パイプラインサーバーを作成できません。関連する認証局バンドルを追加するには、IT 運用管理者に問い合わせてください。 詳細は、証明書の使用 を参照してください。 |
Ready | False False |
エラーメッセージ: 解決策: OpenShift AI 2.8.x を実行しているクラスターでは、データサイエンスパイプラインマネージャーがオブジェクトストレージへの接続に失敗し、パイプラインサーバーが作成されない可能性があります。 オブジェクトストアの認証情報と接続情報が正確であることを確認し、データサイエンスプロジェクトに関連付けられた OpenShift namespace 内からオブジェクトストアにアクセスできることを確認します。よくある問題の 1 つとして、特に自己署名証明書が使用されている場合に、オブジェクトストレージ SSL 証明書が信頼されないことが挙げられます。 オブジェクトストレージの認証情報を確認して更新し、操作を再試行してください。 |
Ready | False False |
エラーメッセージ: 解決策: オブジェクトストレージの正しい認証情報を指定して、操作を再試行してください。 |
Ready | False False |
エラーメッセージ: 解決策: 起動後も問題が解決しない場合は、ネットワークの問題やデータベース接続設定の誤った設定がないか確認してください。 |
Ready | False False |
エラーメッセージ: 解決策: この問題は、Amazon RDS などの外部データベースを使用する場合に発生する可能性があります。データサイエンスパイプラインマネージャーは、データベース SSL 証明書を信頼していないためデータベースに接続できず、パイプラインサーバーの作成が妨げられます。関連する証明書を追加するには、IT 運用管理者に問い合わせてください。 詳細は、証明書の使用 を参照してください。 |
Ready | False False |
エラーメッセージ: 解決策: この問題は、Amazon RDS などの外部データベースを使用しているときに発生する可能性があります。最初に、パイプラインサーバーが正常に作成されます。ただし、しばらくすると、OpenShift AI ダッシュボードに "Error displaying pipelines" というメッセージが表示され、DSPA 条件では、複数の接続エラーが原因でホストがブロックされていることが示されます。 外部 Amazon RDS データベースでこの問題を解決する方法の詳細は、Resolving "Host is blocked because of many connection errors" error in Amazon RDS for MySQL を参照してください。 |
Ready | False False |
エラーメッセージ: 解決策: OpenShift のプロジェクト名が 40 文字未満であることを確認します。 |
Ready | False False |
エラーメッセージ: 解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。 |
Ready | False False |
エラーメッセージ: 解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。 |
Ready | False False |
エラーメッセージ: 解決策: DSPA の起動中に 25 秒以上エラーが続く場合は、不足しているサービスアカウントを再作成します。 |
Ready | False False |
エラーメッセージ: 解決策: DSPA の起動が完了するまで待ちます。25 秒後にデプロイメントが失敗する場合は、ログで詳細情報を確認してください。 |
6.1. DSP コンポーネントに共通するエラー リンクのコピーリンクがクリップボードにコピーされました!
次の表は、複数の DSPA コンポーネントで発生する可能性のあるエラーを示しています。
デプロイメントの状況と状況の種類 | ステータス | エラーメッセージと解決策 |
---|---|---|
状況: Component Deployment Not Found
状況の種類: | False |
エラーメッセージ: 解決策: コンポーネントのデプロイメントがありません。通常、これはデプロイメントの欠落または作成中に発生した問題が原因です。 |
状況: Deployment Scaled Down
条件タイプ: | False |
エラーメッセージ: 解決策: デプロイメントレプリカ数がゼロに設定されているため、コンポーネントは使用できません。 |
状況: Component Failing to Progress
状況の種類: | False |
エラーメッセージ:
解決策: |
状況: Replica Creation Failure
状況の種類: | False |
エラーメッセージ: 解決策: レプリカの作成に失敗しました。通常はレプリカセットまたはサービスアカウントのエラーが原因です。 |
状況: Pod-Level Failures
状況の種類: | False |
エラーメッセージ: 解決策: デプロイメント Pod が失敗した状態です。詳細は Pod ログを確認してください。 |
状況: Pod in CrashLoopBackOff
状況の種類: | False |
エラーメッセージ: 解決策: Pod コンテナーは、環境変数が正しくないか、サービスアカウントが見つからないことが原因で、繰り返し失敗します。 |
状況: Component Deploying (No Errors)
状況: 種類: | False |
エラーメッセージ: 解決策: コンポーネントのデプロイメントプロセスは進行中で、エラーは検出されません。 |
状況: Component Minimally Available
条件タイプ: | True |
エラーメッセージ: 解決策: コンポーネントは使用可能ですが、最小数のレプリカが実行されている場合にのみ使用可能です。 |