Creación de Trabajos

Crear y ejecutar un trabajo en Data Science.

Asegúrese de que ha creado las políticas, la autenticación y la autorización necesarias para sus trabajos.

Antes de empezar:

  • Cree un archivo de artefacto de trabajo o cree un contenedor personalizado.

  • Para almacenar y gestionar logs de trabajos, obtenga información sobre el registro.

  • Para utilizar montajes de almacenamiento, debe tener un cubo de Object Storage o un destino de montaje y una ruta de exportación del servicio OCI File Storage (FSS).

    Para utilizar FSS, primero debe crear el sistema de archivos y el punto de montaje. Utilice la opción de red personalizada y asegúrese de que el destino de montaje y el bloc de notas estén configurados con la misma subred. Configure reglas de lista de seguridad para la subred con los puertos y protocolos específicos.

    Asegúrese de que los límites de servicio se asignan a file-system-count y mount-target-count.

  • Para utilizar montajes de almacenamiento, debe tener un cubo de Object Storage o un punto de montaje del servicio OCI File Storage (FSS).

  • Agregue información básica para el trabajo que está creando.
    1. En la página de la lista de trabajos, seleccione Crear trabajo. Si necesita ayuda para buscar la lista de trabajos, consulte Listado de trabajos.
    2. Seleccione Nodo único si utiliza una única máquina para el trabajo o Varios nodos para trabajos exigentes que se van a ejecutar en varios nodos.
    3. (Opcional) Seleccione un compartimento diferente para el trabajo.
    4. (Opcional) Introduzca un nombre y la descripción para el trabajo (límite de 255 caracteres). Si no se proporciona un nombre, se genera automáticamente un nombre.

      Por ejemplo, job20210808222435

    5. Pasos de configuración de uno o varios nodos
    Uso de la consola para trabajos de nodo único
    Uso de la consola para trabajos de varios nodos
  • Estas variables de entorno controlan el trabajo.

    Utilice la CLI de Data Science para crear un trabajo como en este ejemplo:

    1. Cree un trabajo con:
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
    2. Utilice este archivo JSON de configuración de trabajos:
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. Utilice este archivo JSON de configuración de infraestructura de trabajos:
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (Opcional) Utilice este archivo JSON de configuración de registro de trabajos:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. Cargue un archivo de artefacto de trabajo para el trabajo que ha creado con:
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • El SDK de ADS también es una biblioteca de Python disponible públicamente que puede instalar con este comando:

    pip install oracle-ads

    Proporciona el envoltorio que facilita la creación y la ejecución de trabajos desde blocs de notas o en la máquina cliente.

    Utilice el SDK de ADS para crear y ejecutar trabajos.