大規模モデル・アーティファクトのエクスポート

オブジェクト・ストレージ・バケットからデータ・サイエンス・サービス・バケットにモデル・アーティファクトをエクスポートするには、次のステップを使用します。

ノート

エクスポートは、Java SDK、CLIおよびADS Python SDKのAPIを使用してのみ実行できます。コンソールからエクスポートを実行することはできません。
  1. 必要なポリシーを追加します。
    allow service datascience to manage object-family in compartment <compartment> where ALL {target.bucket.name='<bucket_name>'}
    allow service objectstorage-<region> to manage object-family in compartment <compartment> where ALL {target.bucket.name='<bucket_name>'} 
  2. モデル・アーティファクトをデータ・サイエンス・サービス・ストレージ・バケットにアップロードします。
  3. エクスポート・エンドポイントを呼び出します。artifactSourceTypesourceBucketsourceObjectNamenamespacesourceRegionなどの必要なパラメータを含めます。

    例:

    #sample code
    import ads
    from ads.model import DataScienceModel
    
    ads.set_auth("resource_principal")
    
    MODEL_DISPLAY_NAME = "my_large_model"
    ARTIFACT_FILE_NAME = "my_large_model.zip"
    OCI_BUCKET = "oci://bucket@namespace/prefix/my_large_model.zip"
    
    model = (DataScienceModel()
             .with_display_name(MODEL_DISPLAY_NAME)
             .with_artifact(ARTIFACT_FILE_NAME)
             .create(
                bucket_uri=OCI_BUCKET,
                overwrite_existing_artifact=True, # Overwrite target bucket artifact if exists.
                remove_existing_artifact=True # Wether artifacts uploaded to object storage bucket need to be removed or not.
             )
            ) 
    重要

    bucket_uriを指定する場合は、2 GBを超えるファイルをダウンロードする際のエラーを回避するために、regionも指定する必要があります。

エクスポート処理に対して作業リクエストが作成されます。「作業リクエスト」タブから、モデル・アーティファクトをデータ・サイエンス・サービス・バケットにアップロードする作業リクエストのステータスを確認できます。