自動スケーリング・モデル・デプロイメントの場合
自動スケーリング・モデル・デプロイメントをトラブルシューティングします。
自動スケーリングの問題のトラブルシューティングについては、「モデル・デプロイメントの失敗のデバッグ」を参照してください。自動スケーリング操作では、更新作業リクエスト・タイプが使用されるため、エラーが発生した場合は、失敗した更新作業リクエストを精査します。発生したエラーは、「エラー・メッセージ」に表示されます。エラーの詳細を確認し、適切なアクションを実行します。
操作中にサービスがタイムアウトしました
自動スケーリング・タイプのスケーリング・ポリシーを使用してモデル・デプロイメントを作成、更新またはアクティブ化する場合、操作は「サービスのタイムアウト」エラーで失敗します。
自動スケーリング・サービスによるメトリック取得について、顧客テナンシにIAMポリシーが存在するかどうかがチェックされます。ポリシーがないと、サービスがタイムアウトする可能性があります。
TQL問合せが無効です 🔗
カスタム・メトリックMQL問合せを使用して自動スケーリングを使用してモデルをデプロイすると、操作はエラーで失敗します:
- リクエストのパラメータが無効なため、コンピュート・リソースのプロビジョニングに失敗しました。TQL問合せが無効です。
問合せが正しくないか無効です。
スケーリングがトリガーされないか、完了に時間がかかりすぎる 🔗
スケーリングはトリガーされないか、完了に時間がかかりすぎます。
モデル・デプロイメントのスケーリング操作は、ベスト・エフォート・ベースで動作します。自動スケーリングを有効にしたモデル・デプロイメントの作成後、クールダウン期間が強制されます。自動スケーリングは、クールダウン時間の終了後にのみトリガーされます。
ノート
このクールダウン期間は、作成または更新の後、および各スケーリング・イベントの間に適用されます。また、このクールダウン期間は、ユーザーが実行したすべての更新操作後にリセットされます。
モデル・デプロイメントでスケーリング操作が開始されると、プロセスの完了には平均で最大6分かかる場合があります。スケーリング時間の期間は、主にアーティファクトのサイズの影響を受けます。アーティファクト・サイズが大きい場合、モデル・デプロイメントではブートストラップにより多くの時間がかかる可能性があるため、スケーリング操作の全体的な期間が延長されます。このクールダウン期間は、作成または更新の後、および各スケーリング・イベントの間に適用されます。また、このクールダウン期間は、ユーザーが実行したすべての更新操作後にリセットされます。