モデル・デプロイメント
モデル・デプロイメントをトラブルシューティングします。
モデル・デプロイメントの失敗のデバッグ
新しいデプロイメントを作成したり、既存のデプロイメントを更新すると、失敗することがあります。次のステップでは、問題をデバッグする方法を示します:
- プロジェクトのホームページで、「モデル・デプロイメント」をクリックします。
- モデル・デプロイメント名を選択するか、モデル・デプロイメントの「アクション」メニューをクリックし、「詳細の表示」を選択します。次に、作業リクエストを確認します
- 「リソース」で、「作業リクエスト」を選択します。
作業リクエストはページの下部に表示されます。
- 「作業リクエスト情報」ページで、「ログ・メッセージ」をクリックします。
- 作成ステップでエラーが発生した場合は、「リソース」で「エラー・メッセージ」を選択します。
- 作業リクエストが成功を示している場合、OCI予測ログを確認してエラーを特定します。
ログは、作成時にモデル・デプロイメントにアタッチされます。
- ログがアタッチされている場合は、予測ログ名を選択してログを表示します。
- 「ログ検索で探索」を選択します。
- フィルタ時間を変更して期間を長くします。
Conda環境パスにアクセスできません
conda環境パスが有効であり、公開されたconda環境に適切なポリシーを構成していることを確認します。デプロイ済モデルの可用性と適切な機能を確保するには、モデル・デプロイメントのライフサイクル全体を通じて、conda環境パスが有効でアクセス可能である必要があります。
Webサーバーの起動中にエラーが発生しました
モデル・デプロイメントの予測ログを有効にして、エラーのデバッグに役立てます。通常、これはコードに問題があるか、必要な依存関係がない場合に発生します。
モデル・デプロイメントの呼出しの失敗
モデル・デプロイメントがアクティブなlifecycleState
の場合、予測エンドポイントを呼び出すことができます。予測レスポンスは、様々な理由で失敗を返すことがあります。次の推奨事項を使用して、これらのエラーを解決します:
-
リクエストで渡された入力が有効なJSON形式であり、モデルで予想される入力と一致していることを確認します。
-
アタッチされているアクセス・ログでエラーを確認します。
-
ユーザーに正しいアクセス権があることを確認します。
-
score.py
ファイルにエラーが含まれていないことを確認します。 -
予測が同じ入力に対してコールされるたびに異なる結果(成功、失敗)を返す場合、割り当てられたリソースがモデル予測を提供するには十分でない可能性があります。ロード・バランサ帯域幅を編集してその帯域幅を増やし、コンピュート・コア数を編集して、より多くのリクエストを並行して処理できます。
要求が多すぎます(ステータス429)
予測エンドポイントのコール中にエラーが発生しました。これは、リクエストがスロットルされていることを意味します。このエラーに対処するには、モデル・デプロイメントのロード・バランサ帯域幅を増やします。帯域幅は、予想される1秒当たりのリクエスト数、およびリクエスト当たりのリクエストとレスポンスのペイロードの合計サイズを使用して見積ることができます。