ジョブ実行の開始

データ・サイエンス・ジョブ実行を使用して、作成されたジョブに様々なユースケースを適用します。

ジョブ作成は、インフラストラクチャと実際のユース・ケース・アーティファクトを設定しますが、ジョブ実行は、指定したパラメータで実際にジョブを実行します。ジョブ実行は、指定されたインフラストラクチャをプロビジョニングし、ジョブ・アーティファクトを実行し、ジョブ実行が終了すると使用済リソースをプロビジョニング解除して破棄します。

    1. ジョブ・リスト・ページで、操作するジョブの名前を選択します。ジョブのリストの検索に関するヘルプが必要な場合は、ジョブのリストを参照してください。
    2. 「ジョブ実行の開始」を選択します。
    3. (オプション)ジョブに別のコンパートメントを選択します。
    4. (オプション)ジョブ実行の一意の名前を入力します(255文字の制限)。名前を指定しない場合、名前は自動生成されます。

      たとえば、jobrun20210808222435です。

    5. (オプション)ロギングを使用するには、「選択」を選択し、「ロギングの有効化」が選択されていることを確認します。
      1. リストからログ・グループを選択します。別のコンパートメントに変更して、ジョブとは異なるコンパートメントのログ・グループを指定できます。
      2. 次のいずれかを選択して、すべてのstdoutおよびstderrメッセージを格納します。
        自動ログ作成の有効化

        ジョブの開始時に、データ・サイエンスによってログが自動的に作成されます。

        ログの選択

        使用するログを選択します。

      3. 「選択」を選択して、ジョブ実行作成ページに戻ります。
    6. (オプション)次のオプションを使用して、ジョブの作成時に定義されたBring Your Own Container構成をオーバーライドします:
      1. 「環境構成」で、「選択」を選択します。「BYOC環境の設定」パネルが表示されます。
      2. 「リポジトリ」で、リストからリポジトリを選択します。リポジトリが別のコンパートメントにある場合は、「コンパートメントの変更」を選択します。
      3. 「イメージ」で、リストからイメージを選択します。
      4. (オプション)「エントリ・ポイント」にエントリ・ポイントを入力します。もう1つ追加するには、+Addパラメータを選択します。
      5. (オプション)CMDにCMDを入力します。もう1つ追加するには、+Addパラメータを選択します。
        ノート

        ENTRYPOINTの引数としてCMDを使用するか、ENTRYPOINTがない場合に実行する唯一のコマンドとして使用します。
      6. (オプション)「イメージ・ダイジェスト」に、イメージ・ダイジェストを入力します。
      7. (オプション)「署名ID」で、署名検証を使用する場合は、イメージ署名のOCIDを入力します。たとえば、ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...です。
      8. 「選択」を選択します。
    7. (オプション)次のオプションを使用して、ジョブの作成時に定義されたデフォルトのジョブ構成を上書きします:
      以下のいずれかの値を入力または選択します。
      カスタム環境変数キー

      ジョブを制御する環境変数

      カスタム環境変数キーの値。

      「追加のカスタム環境キー」を選択して、さらに変数を指定できます。

      コマンドライン引数

      ジョブの実行に使用するコマンドライン引数。

      最大実行時間(分)

      ジョブを実行できる最大分数。サービスは、実行時間が指定された値を超えた場合にジョブ実行を取り消します。最大ランタイムは30日(43,200分)です。ランナウェイ・ジョブ実行を回避するために、すべてのジョブ実行に最大実行時間を構成することをお薦めします。

    8. (オプション)「拡張オプションの表示」を選択して、ジョブ実行にタグを追加します。
    9. (オプション)タグ・ネームスペース(定義済のタグの場合)、キーおよび値を入力して、リソースにタグを割り当てます。

      複数のタグを追加するには、「タグの追加」を選択します。

      タグ付けに関する項では、コスト・トラッキング・タグなど、リソースの整理および検索に使用できる様々なタグについて説明します。

    10. 「開始」を選択します。
  • これらの環境変数は、ジョブを制御します。

    データ・サイエンスCLIを使用して、次の例のようにジョブ実行を開始します:

    1. 次を使用してジョブ実行を開始します:
      oci data-science job-run create \
      --display-name <job_run_name> \
      --compartment-id <compartment_ocid> \
      --project-id <project_ocid> \
      --job-id <job_ocid> \
      --configuration-override-details file://<optional_job_run_configuration_override_json_file> \
      --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
    2. (オプション)このジョブ実行構成オーバーライドJSONファイルを使用して、親ジョブで定義された構成をオーバーライドします:
      jobEnvironmentConfigurationDetails: {
        jobEnvironmentType: "OCIR_CONTAINER",
          image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
          imageDigest: "sha256",
        cmd: ["ls", "-h"],
        entrypoint: ["-l"],
          imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
      },
          jobConfigurationDetails: {
              jobType: "DEFAULT",
              environmentVariables: <envar-list-object>},
          ...
      }
    3. (オプション)このジョブ実行ロギング構成オーバーライドJSONファイルを使用して、親ジョブで定義されたロギング構成をオーバーライドします:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
  • ADS SDKは、次のコマンドを使用してインストールできる、パブリックに使用可能なPythonライブラリでもあります:

    pip install oracle-ads

    ノートブックまたはクライアント・マシンでのジョブの開始を容易にするラッパーを提供します。

    ADS SDKを使用してジョブ実行を開始します