OCI生成AIに専用のAIクラスタ・リソースを作成し、事前トレーニング済ベース・モデルおよびカスタム・モデルのエンドポイントをホストします。
重要
- オンデマンドで使用不可:テキスト生成および集計API (プレイグラウンドを含む)を使用するオンデマンド・サービング・モードでサポートされているすべてのOCI生成AI基礎事前トレーニング済モデルが廃止されました。かわりにチャット・モデルを使用することをお薦めします。
- クラスタでホスト可能:専用AIクラスタ(専用サービス・モード)で集計または
cohere.command
などの生成モデルをホストする場合、そのモデルが廃止されるまで引き続き使用できます。これらのモデルは、専用AIクラスタでホストされている場合、米国中西部(シカゴ)でのみ使用できます。廃止日と定義については、モデルの廃止を参照してください。
-
コンソールのナビゲーション・バーで、生成AIを含むリージョン(米国中西部(シカゴ)や英国南部(ロンドン)など)を選択します。リージョンで提供されるモデルを参照してください。
-
ナビゲーション・メニューを開き、「アナリティクスとAI」をクリックします。「AIサービス」で、「生成AI」をクリックします。
-
モデルをホストするコンパートメントを選択します。
このコンパートメント内の
generative-ai-family
および
object-family
リソースを使用または管理する
権限があることを確認します。
-
左側のナビゲーションで、作業する権限があるコンパートメントを選択します。
-
「専用AIクラスタ」をクリックします。
-
「専用AIクラスタの作成」をクリックします。
-
専用AIクラスタを作成するコンパートメントを選択します。デフォルト・コンパートメントはステップ3で選択したコンパートメントですが、作業する権限がある任意のコンパートメントを選択できます。
- (オプション)クラスタの名前と説明を入力します。名前を入力しないと、後で変更できる名前が生成されます。
生成された名前の形式はgenerativeaidedicatedaicluster<timestamp>
です。例: generativeaidedicatedaicluster20240601202357
-
「クラスタ・タイプ」で、「ホスティング」をクリックします。
-
「ベース・モデル」で、このクラスタでホストするモデルの基礎ベース・モデルを選択します。モデル・リストには、オンデマンド・モードに対してまだリタイアされていないベース・モデルのみが含まれます。
- (オプション)「モデル・レプリカ」フィールドでインスタンスの数を増やします。
重要
推論のモデルをホストするクラスタを作成すると、デフォルトで、選択したベース・モデルに対して1つのユニットが作成されます。スループットを向上させるには、「モデル・レプリカ」フィールドのインスタンス数を今すぐ増やすか、後でクラスタを編集するときに増やすことができます。たとえば、このクラスタで2つのモデル・レプリカを作成するには、2つのユニットが必要です。
-
ホスティング・クラスタのコミットメント・ユニット時間を読み取り、コミットメントに同意するチェックボックスを選択します。
- (オプション)「拡張オプションの表示」をクリックし、このクラスタにタグを割り当てます。
-
「作成」をクリックします
ノート
クラスタの作成には数分かかります。クラスタがアクティブ状態になったら、そのモデルのエンドポイントを作成するときに、そのクラスタを選択してモデルをホストできます。