ファインチューニング

ファインチューニングとは、事前トレーニング済モデルを取得し、ドメイン固有のデータセットでさらにトレーニングして、その知識を向上させ、そのドメインでより適切なレスポンスを提供するプロセスです。

AIクイック・アクションでモデルを微調整する場合、それを行うためのデータ・サイエンス・ジョブを作成します。データ・サイエンス・ジョブを使用して、AIクイック・アクションの基盤モデルを微調整するための微調整ジョブを作成するには、必要なポリシーが必要です。ファインチューニング・ジョブを作成するときに、ベース・モデルをトレーニングするデータセットを選択できます。モデル・エクスプローラでReady to Fine Tuneというタグを持つ基本モデルは、ファインチューニングできます。オブジェクト・ストレージからデータセットを選択するか、作業中のノートブックのストレージからデータセットをアップロードできます。ノートブックからデータセットをアップロードすると、ファインチューニング・モデルが保存されるオブジェクト・ストレージ・バケットに保存されます。したがって、ノートブック・セッションがObject Storageにファイルを書き込むようにするポリシーが必要です。データセットはJSONL形式である必要があり、必要な'prompt'および'completion'列が含まれている必要があります。オプションで、'category'列を含めることができます。同じ名前のデータセット・ファイルがバケットにすでに存在する場合、新しいファイルに置き換えられます。ファインチューニングするには、データセットに少なくとも100個のレコードが含まれている必要があります。

データセットの割合をモデル検証用に設定するオプションがあります。モデル・バージョン・セットは、相互に関連するモデルのセットをグループ化する方法です。既存のモデル・バージョン・セットを選択して、ファインチューニング・モデルを配置したり、新しいモデルを作成できます。バージョニングを有効にする必要があるオブジェクト・ストレージ・バケットにファインチューニング・モデルを保存できます。

モデル情報、データセット、モデル・バージョン・セットを入力し、ファインチューニング・モデルを保存する場所を入力したら、微調整ジョブ用のコンピュート・インフラストラクチャおよびネットワークを選択できます。オプションで、ロギングを設定して、ファインチューニング・ジョブを監視できます。ジョブのエラーをトラブルシューティングするためのロギングをお薦めします。ロギングを設定するには、必要なポリシーが必要です。複数のGPUカードを使用した単一ノードのトレーニングおよびトレーニングがサポートされています。モデル、エポックおよび学習レートを微調整するためのパラメータを指定できます。

ジョブの作成前に、ファインチューニング・ジョブに設定した構成およびパラメータを確認できます。

1. モデル・エクスプローラにナビゲートします。
2. ファインチューニングする基礎モデルのモデル・カードを選択します。
3. 「調整」を選択して、データセットでモデルを微調整します。
  「ファインチューニング・モデルの作成」ページが表示されます。
4. デフォルト名を受け入れるか、ファインチューニング・モデルの名前を入力します。
5. (オプション)説明を追加します。
6. データセットを指定するには、「既存のデータセットの選択」または「ノートブック・ストレージからデータセットをアップロード」を選択します。
7. (オプション)ステップ6で「既存のデータセットの選択」を選択した場合は、コンパートメントを選択します。
8. (オプション)ステップ6で「既存のデータセットの選択」を選択した場合は、データセットのオブジェクト・ストレージの場所を選択します。
9. (オプション)検証に使用するデータセットの割合を示すために、検証分割を指定します。
10. モデル・バージョン・セットを指定するには、「既存のバージョン・セットの選択」または「新規バージョン・セットの作成」を選択します。
11. (オプション)「既存のバージョン・セットの選択」を選択した場合は、バージョン・セットを選択します。
12. (オプション)「新規バージョン・セットの作成」を選択した場合:
  
  バージョン・セット名を入力します。
  
  オプション: バージョン・セットに説明を指定します。
13. 結果を格納するオブジェクト・ストレージ・バケットを指定します:
  
  コンパートメントの選択
  
  オブジェクト・ストレージの場所を選択します。
  
  オプション: オブジェクト・ストレージ・パスを指定します。
14. 「次」を選択します。
15. 「インフラストラクチャ」で、使用する「インスタンス・シェイプ」を選択します。
16. 「レプリカ」で、シェイプのインスタンス数を指定します。
17. (オプション)「ネットワーキング」で、使用するVCNおよびサブネットを選択します。
18. (オプション)「ロギング」で、使用するログ・グループおよびログを選択します。
19. 「パラメータ」で、使用するエポックの数と学習レートを指定します。
20. 「次」を選択します。
  作成するファインチューニングのレビュー・ページが表示されます。
21. 「送信」を選択して、ファインチューニングを開始します。
AIクイック処理CLIコマンドのパラメータおよび値の完全なリストは、AIクイック処理CLIを参照してください。
このタスクはAPIを使用して実行できません。

Oracle Cloud Infrastructureドキュメント

ファインチューニング