Creación de Trabajos

Crear y ejecutar un trabajo en Data Science.

Asegúrese de que ha creado las políticas, la autenticación y la autorización necesarias para sus trabajos.

Antes de empezar:

Cree un archivo de artefacto de trabajo o cree un contenedor personalizado.
Para almacenar y gestionar registros de trabajos, obtenga información sobre el registro.
Para utilizar montajes de almacenamiento, debe tener un cubo de Object Storage o un destino de montaje y una ruta de exportación del servicio OCI File Storage (FSS).

Para utilizar FSS, primero debe crear el sistema de archivos y el punto de montaje. Utilice la opción de red personalizada y asegúrese de que el destino de montaje y el bloc de notas estén configurados con la misma subred. Configure reglas de lista de seguridad para la subred con los puertos y protocolos específicos.

Asegúrese de que los límites de servicio se asignan a file-system-count y mount-target-count.
Para utilizar montajes de almacenamiento, debe tener un cubo de Object Storage o un punto de montaje del servicio OCI File Storage (FSS).

Agregue información básica para el trabajo que está creando.
1. En la página de lista de trabajos, seleccione Crear trabajo. Si necesita ayuda para encontrar la lista de trabajos, consulte Lista de trabajos.
2. Seleccione Nodo único si utiliza una única máquina para el trabajo o Varios nodos para trabajos exigentes que se van a ejecutar en varios nodos.
3. (Opcional) Seleccione un compartimento diferente para el trabajo.
4. (Opcional) Introduzca un nombre y la descripción para el trabajo (límite de 255 caracteres). Si no se proporciona un nombre, se genera automáticamente un nombre.
  
  Por ejemplo, job20210808222435
5. Pasos de configuración de uno o varios nodos
  
  Si ha seleccionado Nodo único, siga los pasos de Uso de la consola para trabajos de nodo único.
  
  Si ha seleccionado MultiNodo, siga los pasos de Uso de la consola para trabajos de varios nodos.
Uso de la consola para trabajos de nodo único
Uso de la consola para trabajos de nodo único

Los pasos de configuración necesarios y opcionales para un trabajo de nodo único.

Pasos de configuración necesarios

Pasos de configuración opcionales

Revisar y crear

Pasos de configuración necesarios

Pasos de configuración necesarios específicos para crear un trabajo de nodo único.

Cree una configuración del trabajo por defecto, que se utilice cuando se ejecute el trabajo mediante estas opciones.

Introduzca o seleccione cualquiera de los siguientes valores:

Clave de variable de entorno personalizada

Las variables de ambiente que controlan el trabajo.

Nota

Si ha cargado un archivo zip o un archivo tar comprimido, agregue JOB_RUN_ENTRYPOINT como variable de entorno personalizada para que apunte al archivo.

Valor

Valor de la clave de variable de entorno personalizada.

Puede seleccionar Clave de entorno personalizada adicional para especificar más variables.

Argumentos de la línea de comandos

Argumentos de la línea de comandos que desea utilizar para ejecutar el trabajo.

Tiempo de ejecución máximo (en minutos)

Número máximo de minutos que puede ejecutarse el trabajo. El servicio cancela la ejecución del trabajo si su tiempo de ejecución supera el valor especificado. El tiempo de ejecución máximo es de 30 días (43.200 minutos). Se recomienda configurar un tiempo de ejecución máximo en todas las ejecuciones de trabajos para evitar ejecuciones de trabajos sin control.

Seleccione una forma de cálculo.
(Opcional) Cambie la unidad de computación seleccionando Cambiar unidad. A continuación, siga estos pasos en el panel Seleccionar cálculo.

Seleccione un tipo de instancia.

Seleccione una serie de formas.

Seleccione una de las unidades de Compute soportadas en la serie.

Seleccione la unidad que mejor se adapte a cómo desea utilizar el recurso.

Para cada OCPU, seleccione hasta 64 GB de memoria y un total máximo de 512 GB. La cantidad mínima de memoria permitida es de 1 GB o un valor que coincida con el número de OCPU, cualquiera que sea mayor.

Si utiliza máquinas virtuales ampliables, conmute Burstable.
En Utilización de base por OCPU, seleccione el porcentaje de OCPU que normalmente desea utilizar. Los valores soportados son 12,5% y 50%.

Seleccione Seleccionar unidad.

En Almacenamiento, introduzca la cantidad de almacenamiento de bloques que se utilizará entre 50 GB y 10, 240 GB (10 TB). Puede cambiar el valor en incrementos de 1 GB.
Seleccione una de las siguientes opciones para configurar el tipo de red:

Red por defecto: la carga de trabajo se asocia mediante una VNIC secundaria a una VCN y una subred preconfiguradas gestionadas por el servicio. Esta subred proporcionada permite la salida a la red pública de Internet a través de un gateway de NAT y el acceso a otros servicios de Oracle Cloud a través de un gateway de servicio.

Si solo necesita acceder a los servicios públicos de Internet y OCI, recomendamos utilizar esta opción. No es necesario que cree recursos de red ni escriba políticas para los permisos de red.

Red personalizada: seleccione la VCN y una subred que desea utilizar para el trabajo.

Para obtener acceso de salida a la red pública de Internet, utilice una subred privada con una ruta a un gateway de NAT.

Si no ve la VCN o la subred que desea utilizar, haga clic en Cambiar compartimento y, a continuación, seleccione el compartimento que contiene la VCN o la subred.

Importante

La red personalizada se debe utilizar para utilizar un montaje de almacenamiento de archivos

Este paso es opcional sólo si BYOC está configurado. Cargue el artefacto de trabajo arrastrando el archivo de artefacto de trabajo necesario al cuadro.
Seleccione Next (Siguiente).

Pasos de configuración opcionales

Pasos de configuración específicos para crear un trabajo de nodo único.

(Opcional) Para utilizar el registro, seleccione Seleccionar y, a continuación, asegúrese de que se ha seleccionado Activar registro.

Seleccione un grupo de logs en la lista. Puede cambiar a un compartimento diferente para especificar un grupo de logs de un compartimento diferente al del trabajo.

Seleccione una de las siguientes opciones para almacenar todos los mensajes stdout y stderr:

Activar creación automática de logs

Data Science crea automáticamente un log cuando se inicia el trabajo.

Seleccione un log

Seleccione el log que desea utilizar.

Seleccione Seleccionar para volver a la página de creación de ejecución de trabajo.

(Opcional) Para utilizar Bring Your Own Container, en la configuración del entorno seleccione Seleccionar.
En el panel Set your BYOC environment, siga estos pasos:

En Repositorio, seleccione un repositorio de la lista. Si el repositorio está en un compartimento diferente, seleccione Cambiar compartimento.

En Imagen, seleccione una imagen de la lista.

(Opcional) En Punto de entrada, introduzca un punto de entrada. Para agregar otro parámetro, seleccione +Add.

(Opcional) En CMD, introduzca un CMD. Para agregar otro parámetro, seleccione +Add.
Nota

Utilice CMD como argumentos para ENTRYPOINT o como único comando que ejecutar en ausencia de ENTRYPOINT.

(Opcional) En Resumen de imagen, introduzca un resumen de imagen.

(Opcional) En ID de firma, si utiliza la verificación de firma, introduzca el OCID de la firma de imagen. Por ejemplo, ocid1.containerimagesignature.oc1.iad.aaaaaaaaab....

Seleccione Seleccionar.

(Opcional) Para utilizar montajes de almacenamiento, seleccione +Add storage mount.
Asegúrese de tener la autorización para usar montajes de almacenamiento.

Seleccione un tipo de montaje de almacenamiento, OCI Object Storage o OCI File Storage.

Seleccione un compartimento que contenga el recurso de almacenamiento que desea montar.

Seleccione una de las siguientes opciones:

Object Storage

Si utiliza redes personalizadas:

Cree el gateway del servicio en la VCN.

Para las configuraciones de tabla de rutas en la subred privada, agregue el gateway de servicio.

Cambie las reglas de salida de la lista de seguridad de la subred necesaria para permitir el tráfico a todos los servicios de la red.

Cubo que desea utilizar.

Puede agregar un prefijo de nombre de objeto. El prefijo debe empezar por un carácter alfanumérico. Los caracteres permitidos son los alfanuméricos, la barra ( / ), el guion ( - ) y el guion bajo ( _ ).

File Storage

El destino de montaje y la ruta de exportación que desea utilizar. Debe haber creado el sistema de archivos. Especifique un destino de montaje existente o cree uno nuevo.

Debe utilizar una red personalizada para utilizar el almacenamiento de archivos.

Siga las reglas de la lista de seguridad de la subred.
Nota

Antes de montar un sistema de archivos, debe configurar reglas de seguridad en la subred de la VCN para permitir el tráfico de red hacia y desde el destino de montaje. Puede configurar reglas de seguridad en listas de seguridad de subred, grupos de seguridad de red o mediante una combinación de ambos. Para obtener más información, consulte Configuración de reglas de seguridad de VCN para File Storage.

Entrada con estado para los puertos 111, 2048, 2049 y 2050 de TCP, y los puertos 111 y 2048 de UDP.

Salida con estado para los puertos de origen TCP 111, 2048, 2049 y 2050, y puerto de origen UDP 111.

Introduzca la ruta en la que se montará el almacenamiento.

El almacenamiento se monta en la ruta de montaje especificada. La ruta debe comenzar con un carácter alfanumérico. El directorio de destino debe ser único en los montajes de almacenamiento proporcionados. Los caracteres permitidos son alfanuméricos, guiones ( - ) y guiones bajos ( _ ).

Puede especificar la ruta de acceso completa, como /opc/storage-directory. Si sólo se especifica un directorio, como /storage-directory, se monta en el directorio /mnt por defecto. No puede especificar directorios específicos del sistema operativo, como /bin o /etc.

Seleccione Enviar.

Repita estos pasos para agregar hasta dos montajes de almacenamiento para sesiones de bloc de notas.

Agregue un sondeo de inicio. Seleccione Seleccionar.

Introduzca un comando.

(Opcional) Para agregar otro comando, seleccione comando +Add y repita el paso a.

(Opcional) Introduzca un valor para el retraso inicial (en segundos).

(Opcional) Introduzca un valor para el periodo.

(Opcional) Introduzca un valor para el umbral de fallo.

Seleccione Guardar.

(Opcional) Seleccione Mostrar opciones avanzadas para agregar etiquetas al trabajo.
(Opcional) En la sección Etiquetas, agregue una o más etiquetas al trabajo. Si tiene permisos para crear un trabajo, también tiene permisos para aplicar etiquetas de formato libre a ese trabajo. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de la etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.
Seleccione Next (Siguiente).

Revisar y crear

Revise y cree el trabajo.

Revise el puesto.
Para actualizar cualquier parte de la configuración del trabajo, seleccione Editar en la sección adecuada.

Cuando esté satisfecho con la configuración, seleccione Crear para crear el trabajo.

Una vez que el trabajo tenga el estado activo, podrá usar ejecuciones de trabajo para ejecutar el trabajo de forma repetida.
Uso de la consola para trabajos de varios nodos
Uso de la consola para trabajos de varios nodos

Los pasos de configuración necesarios y opcionales para un trabajo de varios nodos.

Pasos de configuración necesarios

Pasos de configuración opcionales

Revisar y crear

Pasos de configuración necesarios

Pasos de configuración necesarios específicos para crear un trabajo de varios nodos.

Seleccione una de las siguientes opciones para configurar el tipo de red:

Red por Defecto: la carga de trabajo se asocia mediante una VNIC secundaria a una VCN y a una subred preconfigurada y gestionadas por servicio. Esta subred proporcionada permite el acceso a la Internet pública a través de un gateway de NAT y al acceso a otros servicios de la nube de Oracle Cloud a través de un gateway de servicio.

Si solo necesita acceso a los servicios públicos de Internet y OCI, le recomendamos que utilice esta opción. No es necesario que cree recursos de red ni escriba políticas para permisos de red.

Red personalizada: seleccione la VCN y subred que desea utilizar para el trabajo.

Para obtener acceso de salida a la red pública de Internet, utilice una subred privada con una ruta a un gateway de NAT.

Si no ve la VCN o la subred que desea utilizar, haga clic en Cambiar compartimento y, a continuación, seleccione el compartimento que contiene la VCN o la subred.

Importante

Las redes personalizadas se deben utilizar para utilizar un montaje de almacenamiento de archivos.

Este paso es opcional sólo si BYOC está configurado. Cargue el artefacto de trabajo arrastrando el archivo de artefacto de trabajo necesario al cuadro.
(Opcional) Introduzca el tiempo de ejecución máximo (en minutos entre 5 y 43200).
Seleccione Agregar grupo de nodos.
Introduzca un nombre único para el grupo de nodos.
Introduzca el número de réplicas.
Introduzca el número mínimo de réplicas que se deben realizar correctamente.
En Almacenamiento, introduzca la cantidad de almacenamiento de bloques que se utilizará entre 50 GB y 10, 240 GB (10 TB). Puede cambiar el valor en incrementos de 1 GB.
(Opcional) Introduzca la configuración por defecto:

Introduzca la clave de variable de entorno personalizada y un valor para ella.

Seleccione +Additional clave de entorno personalizada para agregar otra clave de variable de entorno personalizada y repetir el paso a.

Introduzca los argumentos de línea de comandos.

Nota

Si cargó un archivo zip o un archivo tar comprimido, agregue JOB_RUN_ENTRYPOINT como una variable de entorno personalizada para que apunte al archivo.

Seleccione una unidad de computación.
(Opcional) Cambie la unidad de computación seleccionando Cambiar unidad. A continuación, siga estos pasos en el panel Seleccionar recursos informáticos.

Seleccione un tipo de instancia.

Seleccione una serie de formas.

Seleccione una de las unidades de Compute soportadas en la serie.

Seleccione la unidad que mejor se adapte a cómo desea utilizar el recurso.

Para cada OCPU, puede seleccionar hasta 64 GB de memoria y un máximo total de 512 GB. La cantidad mínima de memoria permitida es de 1 GB o un valor que coincida con el número de OCPU, cualquiera que sea mayor.

Si utiliza máquinas virtuales ampliables, conmute Burstable.
En Utilización de base por OCPU, seleccione el porcentaje de OCPU que normalmente desea utilizar. Los valores soportados son 12,5% y 50%.

Seleccione Seleccionar unidad.

Para utilizar Traiga su propio contenedor, en la configuración de entorno seleccione Seleccionar.
En el panel Definir el entorno BYOC, siga estos pasos:

En Repositorio, seleccione un repositorio de la lista. Si el repositorio está en un compartimento diferente, seleccione Cambiar compartimento.

En Imagen, seleccione una imagen de la lista.

(Opcional) En Punto de entrada, introduzca un punto de entrada. Para agregar otro, seleccione parámetro +Add.

(Opcional) En CMD, introduzca un CMD. Para agregar otro, seleccione parámetro +Add.
Nota

Utilice CMD como argumentos para ENTRYPOINT o el único comando que se ejecuta en ausencia de ENTRYPOINT.

(Opcional) En Resumen de imagen, introduzca un resumen de imagen.

(Opcional) En ID de firma, si utiliza la verificación de firma, introduzca el OCID de la firma de imagen. Por ejemplo, ocid1.containerimagesignature.oc1.iad.aaaaaaaaab....

Seleccione Seleccionar.

Agregue un sondeo de inicio. Seleccione Seleccionar.

Introduzca un comando.

(Opcional) Para agregar otro comando, seleccione comando +Add y repita el paso a.

(Opcional) Introduzca un valor para el retraso inicial (en segundos).

(Opcional) Introduzca un valor para el periodo.

(Opcional) Introduzca un valor para el umbral de fallo.

Seleccione Guardar.

Seleccione Agregar.
(Opcional) Para agregar otro grupo de nodos, seleccione Agregar grupo de nodos y repita los pasos anteriores. Puede agregar hasta cinco grupos de nodos.
(Opcional) Si tiene más de un grupo de nodos, especifique el orden de inicio del grupo de nodos, en paralelo o en secuencia.

Pasos de configuración opcionales

Pasos de configuración opcionales al crear un trabajo de varios nodos.

(Opcional) Para utilizar el registro, seleccione Seleccionar y, a continuación, asegúrese que se ha seleccionado Activar registro.

Seleccione un grupo de logs en la lista. Puede cambiar a un compartimento diferente para especificar un grupo de logs de un compartimento diferente al del trabajo.

Seleccione una de las siguientes opciones para almacenar todos los mensajes stdout y stderr:

Activar creación automática de logs

Data Science crea automáticamente un log cuando se inicia el trabajo.

Seleccione un log

Seleccione el log que desea utilizar.

Seleccione Seleccionar para volver a la página del proceso de creación.

(Opcional) Para utilizar montajes de almacenamiento, seleccione +Add montaje de almacenamiento.
Asegúrese de tener la autorización para usar montajes de almacenamiento.

Seleccione un tipo de montaje de almacenamiento, OCI Object Storage u OCI File Storage.

Seleccione un compartimento que contenga el recurso de almacenamiento que desea montar.

Seleccione una de las siguientes opciones:

Almacenamiento de objetos

Si utiliza redes personalizadas:

Cree el gateway del servicio en la VCN.

Para las configuraciones de tabla de rutas en la subred privada, agregue el gateway de servicio.

Cambie las reglas de salida de la lista de seguridad de la subred necesaria para permitir el tráfico a todos los servicios de la red.

El cubo que desea utilizar.

Puede agregar un prefijo de nombre de objeto. El prefijo debe empezar por un carácter alfanumérico. Los caracteres permitidos son alfanuméricos, barra ( / ), guion ( - ) y guion bajo ( _ ).

Almacenamiento de archivos

El destino de montaje y la ruta de exportación que desea utilizar. Debe haber creado el sistema de archivos. Especifique un destino de montaje existente o cree uno nuevo.

Debe utilizar una red personalizada para utilizar el almacenamiento de archivos.

Siga las reglas de la lista de seguridad de la subred.
Nota

Antes de montar un sistema de archivos, debe configurar reglas de seguridad en la subred de la VCN para permitir el tráfico de red hacia y desde el destino de montaje. Puede configurar reglas de seguridad en listas de seguridad de subred, grupos de seguridad de red o mediante una combinación de ambos. Para obtener más información, consulte Configuración de reglas de seguridad de VCN para File Storage.

Entrada con estado para los puertos 111, 2048, 2049 y 2050 de TCP y los puertos 111 y 2048 de UDP.

Salida con estado para los puertos de origen TCP 111, 2048, 2049 y 2050, y puerto de origen UDP 111.

Introduzca la ruta en la que se va a montar el almacenamiento.

El almacenamiento se monta en la ruta de montaje especificada. La ruta debe empezar por un carácter alfanumérico. El directorio de destino debe ser único en todos los montajes de almacenamiento proporcionados. Los caracteres permitidos son alfanuméricos, guiones ( - ) y guiones bajos ( _ ).

Puede especificar la ruta completa, como /opc/storage-directory. Si sólo se especifica un directorio, como /storage-directory, se monta en el directorio /mnt por defecto. No puede especificar directorios específicos del sistema operativo, como /bin o /etc.

Seleccione Enviar.

Repita estos pasos para agregar hasta dos montajes de almacenamiento para sesiones de bloc de notas.

(Opcional) Seleccione Mostrar opciones avanzadas para agregar etiquetas al trabajo.
(Opcional) En la sección Etiquetas, agregue una o más etiquetas al trabajo. Si tiene permisos para crear un trabajo, también tiene permisos para aplicar etiquetas de formato libre a ese trabajo. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de la etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.
Seleccione Next (Siguiente).

Revisar y crear

Revise y cree el trabajo.

Revise el puesto.
Para actualizar cualquier parte de la configuración del trabajo, seleccione Editar en la sección adecuada.

Cuando esté satisfecho con la configuración, seleccione Crear para crear el trabajo.

Una vez que el trabajo tenga el estado activo, podrá usar ejecuciones de trabajo para ejecutar el trabajo de forma repetida.

Estas variables de entorno controlan el trabajo.

Utilice la CLI de Data Science para crear un trabajo como en este ejemplo:

Cree un trabajo con:

oci data-science job create \
--display-name <job_name>\
--compartment-id <compartment_ocid>\
--project-id <project_ocid> \
--configuration-details file://<jobs_configuration_json_file> \
--infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
--log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>

Utilice este archivo JSON de configuración de trabajos:

{
  "jobType": "DEFAULT",
  "maximumRuntimeInMinutes": 240,
  "commandLineArguments" : "test-arg",
  "environmentVariables": {
    "SOME_ENV_KEY": "some_env_value" 
  }
}

Utilice este archivo JSON de configuración de infraestructura de trabajos:

{
  "jobInfrastructureType": "STANDALONE",
  "shapeName": "VM.Standard2.1",
  "blockStorageSizeInGBs": "50",
  "subnetId": "<subnet_ocid>"
}

(Opcional) Utilice este archivo JSON de configuración de registro de trabajos:

{
  "enableLogging": true,
  "enableAutoLogCreation": true,
  "logGroupId": "<log_group_ocid>"
}

Cargue un archivo de artefacto de trabajo para el trabajo que ha creado con:

oci data-science job create-job-artifact \
--job-id <job_ocid> \
--job-artifact-file <job_artifact_file_path> \
--content-disposition "attachment; filename=<job_artifact_file_name>"

El SDK de ADS también es una biblioteca de Python disponible públicamente que puede instalar con este comando:
```
pip install oracle-ads
```
Proporciona el envoltorio que facilita la creación y la ejecución de trabajos desde blocs de notas o en la máquina cliente.

Utilice el SDK de ADS para crear y ejecutar trabajos.

Documentación de Oracle Cloud Infrastructure

Creación de Trabajos

Uso de la consola para trabajos de nodo único

Pasos de configuración necesarios

Pasos de configuración opcionales

Revisar y crear

Uso de la consola para trabajos de varios nodos

Pasos de configuración necesarios

Pasos de configuración opcionales

Revisar y crear