モデルのホスティングのための生成AIでの専用AIクラスタの作成

OCI生成AIに専用のAIクラスタ・リソースを作成し、事前トレーニング済ベース・モデルおよびカスタム・モデルのエンドポイントをホストします。

重要

  • オンデマンドで使用不可:テキスト生成および集計API (プレイグラウンドを含む)を使用するオンデマンド・サービング・モードでサポートされているすべてのOCI生成AI基礎事前トレーニング済モデルが廃止されました。かわりにチャット・モデルを使用することをお薦めします。
  • クラスタでホスト可能:専用AIクラスタ(専用サービス・モード)で集計またはcohere.commandなどの生成モデルをホストする場合、そのモデルが廃止されるまで引き続き使用できます。これらのモデルは、専用AIクラスタでホストされている場合、米国中西部(シカゴ)でのみ使用できます。廃止日と定義については、モデルの廃止を参照してください。
  1. コンソールのナビゲーション・バーで、生成AIを含むリージョン(米国中西部(シカゴ)英国南部(ロンドン)など)を選択します。リージョンで提供されるモデルを参照してください。
  2. ナビゲーション・メニューを開き、「アナリティクスとAI」をクリックします。「AIサービス」で、「生成AI」をクリックします。
  3. モデルをホストするコンパートメントを選択します。
    このコンパートメント内のgenerative-ai-familyおよびobject-familyリソースを使用または管理する権限があることを確認します。
  4. 左側のナビゲーションで、作業する権限があるコンパートメントを選択します。
  5. 「専用AIクラスタ」をクリックします。
  6. 「専用AIクラスタの作成」をクリックします。
  7. 専用AIクラスタを作成するコンパートメントを選択します。デフォルト・コンパートメントはステップ3で選択したコンパートメントですが、作業する権限がある任意のコンパートメントを選択できます。
  8. (オプション)クラスタの名前と説明を入力します。名前を入力しないと、後で変更できる名前が生成されます。

    生成された名前の形式はgenerativeaidedicatedaicluster<timestamp>です。例: generativeaidedicatedaicluster20240601202357

  9. 「クラスタ・タイプ」で、「ホスティング」をクリックします。
  10. 「ベース・モデル」で、このクラスタでホストするモデルの基礎ベース・モデルを選択します。モデル・リストには、オンデマンド・モードに対してまだリタイアされていないベース・モデルのみが含まれます。
    専用のクラスタ・ユニット・サイズについては、クラスタへのベース・モデルの照合を参照してください。クラスタでホストされているモデルのエンドポイントの作成に関するルールは、ホスティング・クラスタへのエンドポイントの追加を参照してください。
  11. (オプション)「モデル・レプリカ」フィールドでインスタンスの数を増やします。
    重要

    推論のモデルをホストするクラスタを作成すると、デフォルトで、選択したベース・モデルに対して1つのユニットが作成されます。スループットを向上させるには、「モデル・レプリカ」フィールドのインスタンス数を今すぐ増やすか、後でクラスタを編集するときに増やすことができます。たとえば、このクラスタで2つのモデル・レプリカを作成するには、2つのユニットが必要です。
  12. ホスティング・クラスタのコミットメント・ユニット時間を読み取り、コミットメントに同意するチェックボックスを選択します。
  13. (オプション)「拡張オプションの表示」をクリックし、このクラスタにタグを割り当てます。
  14. 「作成」をクリックします
    ノート

    クラスタの作成には数分かかります。クラスタがアクティブ状態になったら、そのモデルのエンドポイントを作成するときに、そのクラスタを選択してモデルをホストできます。