専用AIクラスタへの支払い

OCI生成AIで専用AIクラスタを使用する場合、次の利点があります:

  • 需要にあわせて変動しない予測可能な価格設定。
  • ファインチューニングやホスティングモデルに最適です。
  • 最小ホスティング・コミットメント: ホスティング・クラスタ当たり744ユニット時間。
  • 最小ファインチューニング・コミットメント: ファインチューニング・ジョブごとに1単位時間。(モデルによっては、ファインチューニングを実行するには2ユニット以上が必要です)。
ノート

ファインチューニングに使用できるモデルを確認するには、クラスタへのベース・モデルの照合を参照してください。

次の例では、OCI生成AIにおける専用AIクラスタのコストを計算します。オンデマンド推論コストの計算については、「オンデマンド推論の支払」を参照してください。

専用クラスタ単価へのモデルの照合

基盤モデルをホスティングしたり、専用AIクラスタでファインチューニングする場合、トランザクションではなく単位時間で請求されます。この場合、チャット・モデルの専用AIクラスタ・コストの計算については、次の表を参照してください。

重要

専用サービス・モードでサポートされている一部のOCI生成AI基礎事前トレーニング済ベース・モデルは非推奨になり、1番目の置換モデルのリリース後6か月以内に廃止されます。ベース・モデルをホストするか、ベース・モデルをファインチューニングして、ベース・モデルが廃止されるまで、専用AIクラスタ(専用サービング・モード)でファインチューニング・モデルをホストできます。専用サービング・モード・リタイア日については、モデルのリタイアを参照してください。

チャット・モデル

ベース・モデル クラスタのファインチューニング ホスティング・クラスタ 価格設定ページ情報 クラスタ制限増加のリクエスト
  • モデル名: Cohere Command R
  • OCIモデル名: cohere.command-r-16k (非推奨)
  • 単位サイズ: Small Cohere V2
  • 必須ユニット: 8
  • 単位サイズ: Small Cohere V2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Small Cohere - Dedicated
  • ファインチューニングの場合の単価の乗算: x8
  • 制限名: dedicated-unit-small-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ: 1
  • ファインチューニングの場合のリクエスト制限の引上げ: 8
  • モデル名: Command R 08-2024
  • OCIモデル名: cohere.command-r-08-2024
  • 単位サイズ: Small Cohere V2
  • 必要ユニット数: 8
  • 単位サイズ: Small Cohere V2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Small Cohere - Dedicated
  • ファインチューニングの場合の単価の乗算: x8
  • 制限名: dedicated-unit-small-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ: 1
  • ファインチューニングの場合のリクエスト制限の引上げ: 8
  • モデル名: Cohere Command R+
  • OCIモデル名: cohere.command-r-plus (非推奨)
微調整に使用できません
  • 単位サイズ: Large Cohere V2_2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Cohere - Dedicated
  • ホスティングの場合は、単価を乗算します。 x2
  • 制限名: dedicated-unit-large-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ: 2
  • モデル名: Command R+ 08-2024
  • OCIモデル名: cohere.command-r-plus-08-2024
微調整に使用できません
  • 単位サイズ: Large Cohere V2_2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Cohere - Dedicated
  • ホスティングの場合は、単価を乗算します。 x2
  • 制限名: dedicated-unit-large-cohere-count
  • ホスティングの場合、リクエスト制限の引上げ: 2
  • モデル名: Meta Llama 3.2 11B Vision
  • OCIモデル名: meta.llama-3.2-11b-vision-instruct
微調整に使用できません
  • 単位サイズ: Small Generic V2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Meta - Dedicated
  • ホスティングの場合、単価を乗算: x(0.5)
  • 制限名: dedicated-unit-llama2-70-count
  • ホスティングの場合、リクエスト制限の引上げ:1
  • モデル名: Meta Llama 3.2 90B Vision
  • OCIモデル名: meta.llama-3.2-90b-vision-instruct
微調整に使用できません
  • 単位サイズ: Large Generic V2
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Meta - Dedicated
  • ホスティングの場合は、単価を乗算します。 x2
  • 制限名: dedicated-unit-llama2-70-count
  • ホスティングの場合、リクエスト制限の引上げ: 2
  • モデル名: Meta Llama 3.1 (70B)
  • OCIモデル名: meta.llama-3.1-70b-instruct
  • 単位サイズ: Large Generic
  • 必須ユニット: 2
  • 単位サイズ: Large Generic
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Meta - Dedicated
  • ホスティングの場合は、単価を乗算します。 x2
  • ファインチューニングの場合の単価の乗算: x4
  • 制限名: dedicated-unit-llama2-70-count
  • ホスティングの場合、リクエスト制限の引上げ: 2
  • ファインチューニングの場合のリクエスト制限の引上げ: 4
  • モデル名: Meta Llama 3.1 (405B)
  • OCIモデル名: meta.llama-3.1-405b-instruct
微調整に使用できません
  • 単位サイズ: Large Generic 4
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Meta - Dedicated
  • ホスティングの場合は、単価を乗算します。 x8
  • 制限名: dedicated-unit-llama2-70-count
  • ホスティングの場合、リクエスト制限の引上げ: 8
  • モデル名: Meta Llama 3
  • OCIモデル名: meta.llama-3-70b-instruct (非推奨)
  • 単位サイズ: Large Generic
  • 必須ユニット: 2
  • 単位サイズ: Large Generic
  • 必須ユニット: 1
  • 価格設定ページ製品名: Large Meta - Dedicated
  • ホスティングの場合は、単価を乗算します。 x2
  • ファインチューニングの場合の単価の乗算: x4
  • 制限名: dedicated-unit-llama2-70-count
  • ホスティングの場合、リクエスト制限の引上げ: 2
  • ファインチューニングの場合のリクエスト制限の引上げ: 4
重要

次のリソースを使用するには、制限の引上げをリクエストする必要があります:

Meta Llamaファミリ

  • Meta Llama 3.2 11B Vision モデルをホストするには、dedicated-unit-llama2-70-countを1ずつ増やすようにリクエストする必要があります。

  • Meta Llama 3.2 90B Vision モデルをホストするには、dedicated-unit-llama2-70-countに2ずつ増やすようにリクエストする必要があります。

  • Meta Llama 3.1 (70B)モデルをホストするには、dedicated-unit-llama2-70-countに2ずつ増やすようにリクエストする必要があります。

  • Meta Llama 3.1 (70B)モデルを微調整するには、dedicated-unit-llama2-70-countをリクエストして4増やす必要があります。

  • Meta Llama 3.1 (405B)モデルをホストするには、dedicated-unit-llama2-70-countをリクエストして8増やす必要があります。

Cohere Command Rファミリ

  • Cohere Command R (非推奨)モデルをホストするには、dedicated-unit-small-cohere-countに1ずつ増やすようにリクエストする必要があります。

  • Cohere Command R (非推奨)モデルを微調整するには、dedicated-unit-small-cohere-countをリクエストして8増やす必要があります。

  • Cohere Command R 08-2024モデルをホストするには、dedicated-unit-small-cohere-countを1ずつ増やすようにリクエストする必要があります。

  • Cohere Command R 08-2024モデルを微調整するには、dedicated-unit-small-cohere-countをリクエストして8増やす必要があります。

  • Cohere Command R+ (非推奨)モデルをホストするには、dedicated-unit-large-cohere-countに2ずつ増やすようにリクエストする必要があります。

  • Cohere Command R+ 08-2024モデルをホストするには、dedicated-unit-large-cohere-countに2ずつ増やすようにリクエストする必要があります。

参照: 生成AIのサービス制限およびリクエスト・クラスタ制限の引上げ

テキスト生成、要約およびテキスト埋込みモデルの詳細は、「ベース・モデルのクラスタとの照合」の表を参照してください。

基本モデルのホストの例1

Johnは、専用インフラストラクチャでCommand R+ 08-2024 (cohere.command-r-plus-08-2024)モデルのインスタンスをホストしようとしています。Johnは40日後にクラスタを削除し、クラスタのコストを知りたいと考えています。cohere.command-r-plus-08-2024モデルをホストするには、Johnが最初にcohere.command-r-plus-08-2024モデルをホストできるユニット・サイズを識別する必要があります。cohere.command-r-plus-08-2024モデルの単位サイズはLarge Cohere V2_2単位です。クラスタへのベース・モデルの照合を参照してください。

Johnでは、cohere.command-r-plus-08-2024モデルをホストするために少なくとも1つのLarge Cohere V2_2ユニットが必要です。1つのLarge Cohere V2_2単位でホスティング・クラスタのコストを計算するステップを次に示します。

  1. 単位時間を40日間計算します。
    40 days x 24 hours per day x 1 unit = 960 unit hours.
  2. 単位時間がモデルをホストするための最小コミットメントを超えていることを確認してください。
    960 unit hours > 744 minimum unit hours
  3. AIの価格設定にアクセスし、OCI生成AIOracle Cloud Infrastructure Generative AI- Large Cohere - Dedicated<Large-Cohere-dedicated-unit-per-hour-price>を見つけます。
  4. 「ベース・モデルとクラスタの一致」ページで、cohere.command-r-plus-08-2024モデルの乗数を見つけます。
    For Hosting, Multiply the Unit Price: x 2
  5. 価格を40日間計算します。
    price = (960 unit hours) x $<Large-Cohere-dedicated-unit-per-hour-price> x 2

基本モデルのホストの例2

Aliceは、専用インフラストラクチャでCommand R 08-2024 (cohere.command-r-08-2024)モデルのインスタンスをホストしようと考えています。cohere.command-r-08-2024モデルをホストするには、Aliceが最初にCommand R 08-2024モデルをホストできるユニット・サイズを識別する必要があります。Command R 08-2024の単位サイズはSmall Cohere V2単位です。クラスタへのベース・モデルの照合を参照してください。

Aliceは、1つのユニットよりも高いコール量をモデルに対して処理するために、3つの単位のSmall Cohere V2を購入することを決定します。Aliceでは、5日後にクラスタの削除を計画しています。3つのSmall Cohere V2ユニットを持つホスティング・クラスタのコストを5日間計算するステップを次に示します。

  1. ユニット時間の計算
    5 days x 24 hours per day x 3 units = 360 unit hours. 
  2. 単位時間とモデルをホストするための最小コミットメントを比較します。
    360 unit hours < 744 minimum unit hours
    Alice is charged for 744 unit hours.
  3. AIの価格設定にアクセスし、OCI生成AIOracle Cloud Infrastructure Generative AI - Small Cohere - Dedicated<Small-Cohere-dedicated-unit-per-hour-price>を見つけます。
  4. 「ベース・モデルとクラスタの一致」ページで、cohere.command-r-08-2024モデルの乗数を見つけます。

    cohere.command-r-08-2024モデルをホストするために価格を乗算する必要はありません。

  5. 5日間の費用を計算します。
    price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>

モデルの微調整とホスティングの例

Bobは、Command R 08-2024 (cohere.command-r-08-2024)モデルを微調整します。Bobは、事前設定された値が8つのSmall Cohere V2ユニットであるファインチューニング専用AIクラスタを作成します。Bobは、ファインチューニング専用AIクラスタにカスタム・モデルを作成し、トレーニング・データを使用してCommand R 08-2024基礎モデルを微調整します。微調整ジョブの完了には5時間かかります。Bobは毎週ファインチューニング・クラスタを作成します。

cohere.command-r-08-2024モデルをホストするには、Bobがcohere.command-r-08-2024モデルをホストできるユニット・サイズを識別する必要があります。cohere.command-r-08-2024モデルの単位サイズはSmall Cohere V2単位です。クラスタへのベース・モデルの照合を参照してください。Bobは、1つのホスティング・クラスタで最大50個のファインチューニング・モデルをホストできます。ここでは、モデルを微調整およびホスティングするための月次コストを計算するステップを示します。

  1. 各微調整の単位時間を計算します。
    Each fine-tuning cluster requires 8 units and each cluster is active for 5 hours
    fine-tuning per cluster = 40 unit-hours
  2. 単位時間と最小コミットメントを比較して、モデルを微調整します。
    40 unit hours > 1 unit hour
  3. ホスティングの単位時間を計算します。
    31 days x 24 hours per day x 1 unit = 744 unit hours
  4. 単位時間とモデルをホストするための最小コミットメントを比較します。
    744 unit hours = 744 minimum unit hours
  5. AIの価格設定にアクセスし、OCI生成AIOracle Cloud Infrastructure Generative AI - Small Cohere - Dedicated<Small-Cohere-dedicated-unit-per-hour-price>を見つけます。
  6. 月額の合計価格を検索
    fine-tuning price = (40 unit hours) per week x (4 weeks) x $<Small-Cohere-dedicated-unit-per-hour-price> 
                                
    fine-tuning price = 160 x <Small-Cohere-dedicated-unit-per-hour-price>
    hosting price = (744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
    total monthly price = (160 + 744 unit hours) x $<Small-Cohere-dedicated-unit-per-hour-price>
ヒント

価格の計算に加えて、AIおよび機械学習カテゴリを選択し、OCI生成AIのコスト見積りをロードすることで、コストを推定できます。