Inicio de una ejecución de trabajo
Utilice ejecuciones de trabajos de Data Science para aplicar varios casos de uso a trabajos creados.
La creación de los trabajos define la infraestructura y el artefacto del caso del uso real, pero la ejecución de trabajos ejecuta el trabajo con los parámetros especificados. Las ejecuciones de trabajos aprovisionan la infraestructura especificada, ejecutan el artefacto de trabajo y a continuación, anulan el aprovisionamiento y destruyen el recurso utilizado cuando finaliza el trabajo.
- Si está iniciando una ejecución de trabajo de nodo único, siga los pasos de Uso de la consola para iniciar ejecuciones de trabajos de nodo único.
- Si está iniciando una ejecución de trabajo de varios nodos, siga los pasos de Uso de la consola para iniciar ejecuciones de trabajos de varios nodos.
Uso de la consola para iniciar ejecuciones de trabajos de nodo únicoUso de la consola para iniciar ejecuciones de trabajos de nodo único
- En la página de la lista de trabajos, seleccione el nombre del trabajo con el que trabajar. Si necesita ayuda para buscar la lista de trabajos, consulte Listado de trabajos.
- Seleccione Start a job run.
- (Opcional) Seleccione un compartimento diferente para la ejecución del trabajo.
- (Opcional) Introduzca un nombre para la ejecución del trabajo (límite de 255 caracteres). Si no se proporciona un nombre, se genera automáticamente un nombre.
Por ejemplo,
jobrun20210808222435
. - (Opcional) Sustituya la configuración de trabajo por defecto definida cuando se creó el trabajo con estas opciones:
Introduzca o seleccione cualquiera de los siguientes valores:
- Clave de variable de entorno personalizada
-
Variables de entorno que controlan el trabajo.
- Valor
-
Valor de la clave de variable de entorno personalizada.
Puede seleccionar Clave de entorno personalizada adicional para especificar más variables.
- Argumentos de la línea de comandos
-
Argumentos de la línea de comandos que desea utilizar para ejecutar el trabajo.
- Tiempo de ejecución máximo (en minutos)
-
Número máximo de minutos que puede ejecutarse el trabajo. El servicio cancela la ejecución del trabajo si su tiempo de ejecución supera el valor especificado. El tiempo de ejecución máximo es de 30 días (43.200 minutos). Se recomienda configurar un tiempo de ejecución máximo en todas las ejecuciones de trabajos para evitar ejecuciones de trabajos sin control.
- (Opcional) Introduzca un valor para la sustitución de tiempo de ejecución máximo (en minutos).
-
Sustituya la configuración de recursos de red, que se definió cuando se creó el trabajo.
No se puede cambiar el tipo de red.
- Si se configura la red por defecto, no se puede sustituir nada.
- Si se configura la red personalizada, tiene la opción de cambiar la VCN y la subred seleccionadas.
- (Opcional) Cambie la unidad de computación seleccionando Cambiar unidad. A continuación, siga estos pasos en el panel Seleccionar recursos informáticos.
- Seleccione un tipo de instancia.
- Seleccione una serie de formas.
- Seleccione una de las unidades de Compute soportadas en la serie.
-
Seleccione la unidad que mejor se adapte a cómo desea utilizar el recurso.
Para cada OCPU, seleccione hasta 64 GB de memoria y con un máximo de 512 GB en total. La cantidad mínima de memoria permitida es de 1 GB o un valor que coincida con el número de OCPU, cualquiera que sea mayor.
-
Si utiliza máquinas virtuales ampliables, conmute Burstable.
En Utilización de base por OCPU, seleccione el porcentaje de OCPU que normalmente desea utilizar. Los valores soportados son 12,5% y 50%.
- Seleccione Seleccionar unidad.
- (Opcional) Sustituya la configuración de almacenamiento.
Introduzca la cantidad de almacenamiento de bloques que se utilizará entre 50 GB y 10, 240 GB (10 TB). Puede cambiar el valor en incrementos de 1 GB.
-
Sustituya la configuración de entorno, que se definió cuando se creó el trabajo, mediante las siguientes opciones:
- En Configuración de entorno. seleccione Seleccionar. Se muestra el panel Set your BYOC environment.
- En Repositorio, seleccione un repositorio de la lista. Si el repositorio está en un compartimento diferente, seleccione Cambiar compartimento.
- En Imagen, seleccione una imagen de la lista.
- (Opcional) En Punto de entrada, introduzca un punto de entrada. Para agregar otro parámetro, seleccione +Add.
- (Opcional) En CMD, introduzca un CMD. Para agregar otro parámetro, seleccione +Add.Nota
Utilice CMD como argumentos para ENTRYPOINT o como único comando que ejecutar en ausencia de ENTRYPOINT. - (Opcional) En Resumen de imagen, introduzca un resumen de imagen.
- (Opcional) En ID de firma, si utiliza la verificación de firma, introduzca el OCID de la firma de imagen. Por ejemplo,
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
. - Seleccione Seleccionar.
- (Opcional) Sustituya la configuración de registro.
- Seleccione un grupo de logs en la lista. Puede cambiar a un compartimento diferente para especificar un grupo de logs de un compartimento diferente al del trabajo.
-
Seleccione una de las siguientes opciones para almacenar todos los mensajes
stdout
ystderr
:- Activar creación automática de logs
-
Data Science crea automáticamente un log cuando se inicia el trabajo.
- Seleccione un log
-
Seleccione el log que desea utilizar.
- (Opcional) Sustituya el sondeo de inicio.
- Introduzca un comando.
- (Opcional) Para agregar otro comando, seleccione comando +Add y repita el paso a.
- (Opcional) Introduzca un valor para el retraso inicial (en segundos).
- (Opcional) Introduzca un valor para el periodo.
- (Opcional) Introduzca un valor para el umbral de fallo.
- Seleccione Guardar.
- (Opcional) Seleccione Mostrar opciones avanzadas para agregar etiquetas a la ejecución del trabajo.
- (Opcional) En la sección Etiquetas, agregue una o más etiquetas a la ejecución del trabajo. Si tiene permisos para crear una ejecución de trabajo, también tiene permisos para aplicar etiquetas de formato libre a esa ejecución de trabajo. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de la etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.
- Seleccione Iniciar.
Uso de la consola para iniciar ejecuciones de trabajos de varios nodosUso de la consola para iniciar ejecuciones de trabajos de varios nodos
- En la página de lista de trabajos, seleccione el nombre del trabajo con el que desea trabajar. Si necesita ayuda para encontrar la lista de trabajos, consulte Lista de trabajos.
- Seleccione Iniciar una ejecución de trabajo.
- (Opcional) Seleccione un compartimento diferente para la ejecución del trabajo.
- (Opcional) Introduzca un nombre para la ejecución del trabajo (límite de 255 caracteres). Si no se proporciona un nombre, se genera automáticamente un nombre.
Por ejemplo,
jobrun20210808222435
. - (Opcional) Introduzca un valor para la sustitución de tiempo de ejecución máximo (en minutos).
-
Sustituya la configuración de recursos de red, que se definió cuando se creó el trabajo.
No se puede cambiar el tipo de red.
- Si se configura la red por defecto, no se puede sustituir nada.
- Si se configura la red personalizada, tiene la opción de cambiar la VCN y la subred seleccionadas.
- (Opcional) Sustituya la configuración del grupo de nodos, que se definió cuando se creó el trabajo.
Las configuraciones de cada grupo de nodos se pueden sustituir individualmente haciendo clic en el menú Acciones (tres puntos) del grupo de nodos y seleccionando Editar.
- (Opcional) Sustituya el número de réplicas.
- (Opcional) Sustituya el número mínimo de réplicas que se deben realizar correctamente.
- (Opcional) Sustituya el almacenamiento. Introduzca la cantidad de almacenamiento de bloques que se utilizará entre 50 GB y 10, 240 GB (10 TB). Puede cambiar el valor en incrementos de 1 GB.
-
(Opcional) Sustituya la configuración de puesto por defecto mediante las siguientes opciones:
Introduzca o seleccione cualquiera de los siguientes valores:- Clave de variable de entorno personalizada
-
Las variables de ambiente que controlan el trabajo.
- Valor
-
Valor de la clave de variable de entorno personalizada.
Puede seleccionar Clave de entorno personalizada adicional para especificar más variables.
- Argumentos de la línea de comandos
-
Argumentos de la línea de comandos que desea utilizar para ejecutar el trabajo.
-
Cambie la unidad de computación seleccionando Cambiar unidad. A continuación, siga estos pasos en el panel Seleccionar recursos informáticos.
- Seleccione un tipo de instancia.
- Seleccione una serie de formas.
- Seleccione una de las unidades de Compute soportadas en la serie.
-
Seleccione la unidad que mejor se adapte a cómo desea utilizar el recurso.
Para cada OCPU, puede seleccionar hasta 64 GB de memoria y un máximo total de 512 GB. La cantidad mínima de memoria permitida es de 1 GB o un valor que coincida con el número de OCPU, cualquiera que sea mayor.
-
Si utiliza máquinas virtuales ampliables, conmute Burstable.
En Utilización de base por OCPU, seleccione el porcentaje de OCPU que normalmente desea utilizar. Los valores soportados son 12,5% y 50%.
- Seleccione Seleccionar unidad.
- (Opcional) Sustituya la configuración de sondeos:
- Introduzca un comando.
- (Opcional) Para agregar otro comando, seleccione comando +Add y repita el paso a.
- (Opcional) Introduzca un valor para el retraso inicial (en segundos).
- (Opcional) Introduzca un valor para el periodo.
- (Opcional) Introduzca un valor para el umbral de fallo.
- Seleccione Guardar.
- (Opcional) Sustituya la configuración de registro.
- Seleccione un grupo de logs en la lista. Puede cambiar a un compartimento diferente para especificar un grupo de logs de un compartimento diferente al del trabajo.
-
Seleccione una de las siguientes opciones para almacenar todos los mensajes
stdout
ystderr
:- Activar creación automática de logs
-
Data Science crea automáticamente un log cuando se inicia el trabajo.
- Seleccione un log
-
Seleccione el log que desea utilizar.
- (Opcional) Seleccione Mostrar opciones avanzadas para agregar etiquetas a la ejecución del trabajo.
- (Opcional) En la sección Etiquetas, agregue una o más etiquetas a la ejecución del trabajo. Si tiene permisos para crear una ejecución de trabajo, también tiene permisos para aplicar etiquetas de formato libre a esa ejecución de trabajo. Para aplicar una etiqueta definida, debe tener permisos para utilizar el espacio de nombres de la etiqueta. Para obtener más información sobre el etiquetado, consulte Etiquetas de recursos. Si no está seguro de si desea aplicar etiquetas, omita esta opción o pregunte a un administrador. Puede aplicar etiquetas más tarde.
- Seleccione Start (Iniciar).
Estas variables de entorno controlan el trabajo.
Utilice la CLI de Data Science para iniciar ejecuciones de trabajos como en este ejemplo:
-
Inicie una ejecución de trabajo con:
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
- (Opcional) Utilice este archivo JSON de sustitución de configuración de ejecución de trabajo para sustituir las configuraciones definidas en el trabajo principal:
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... }
- (Opcional) Utilice este archivo JSON de sustitución de configuración de registro de ejecución de trabajo para sustituir la configuración de registro definida en el trabajo principal:
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
Inicie una ejecución de trabajo con:
El SDK de ADS también es una biblioteca de Python disponible públicamente que puede instalar con este comando:
pip install oracle-ads
Proporciona el envoltorio que facilita la ejecución de trabajos de inicio desde blocs de notas o en la máquina cliente.
Utilice el SDK de ADS para iniciar ejecuciones de trabajos.