Variables de entorno de despliegue de modelo

Al crear un recurso de despliegue de modelo, puede proporcionar variables de entorno personalizadas como parte de la configuración por defecto. Estas variables de entorno están disponibles para su uso dentro del contenedor en tiempo de ejecución.

Restricción de formato

  • La clave debe tener menos de 32 caracteres.
  • La clave debe contener solo letras, dígitos y guiones bajos (_).
  • La clave debe comenzar con una letra.
  • La clave debe tener al menos 2 caracteres.
  • La clave no debe terminar con el guion bajo. Por ejemplo, TEST_.
  • La clave, si se agrega, no puede estar vacía. El valor puede estar vacío.
  • El valor puede ser cualquier carácter.
  • La clave no puede ser variables de entorno proporcionadas por el servicio.
  • Si los puertos se transfieren como una variable de entorno, limítelos entre 1024 y 65535 y excluya también los puertos 24224, 8446 y 8447.

Restricción de tamaño

Los valores individuales no tienen límites de tamaño específicos. Las variables de entorno generales, incluidos los pares clave-valor, están limitadas a 2048 bytes. Si el tamaño es superior a 2048 bytes, especifique las variables de entorno mediante el artefacto de modelo o utilice OCI Object Storage para extraer los datos.

Variables de entorno proporcionadas por el servicio

El servicio tiene variables de entorno reservadas dentro del contenedor en tiempo de ejecución para el registro u otro uso funcional. Estas variables de entorno no se pueden sustituir.

Nombre Contenedor personalizado Contenedor por defecto
MODEL_DEPLOYMENT_OCID OCID de recurso de despliegue de modelo. OCID de recurso de despliegue de modelo.
MODEL_SERVING_PYTHON_VERSION Ninguna. Versión de Python de runtime.yaml utilizada para servir modelos.
TENANCY_OCID OCID de arrendamiento. OCID de arrendamiento.
CONTAINER_CUSTOM_IMAGE Ruta de imagen de contenedor (con etiqueta o resumen) que se proporciona mediante el objeto de configuración de entorno de API. Ninguna.

Variables de entorno de aplicación

Estas variables de entorno controlan funcionalmente cómo se crea el despliegue del modelo y los clientes pueden sustituirlo o configurarlo transfiriendo la configuración por defecto.

Nombre Contenedor personalizado Contenedor gestionado
WEB_CONCURRENCY Según la memoria disponible y el tamaño del artefacto de modelo, un método heurístico calcula el número de trabajadores necesarios para ejecutarse dentro del contenedor personalizado. Los clientes también pueden sustituir la variable o transferir una variable de simultaneidad personalizada según sea necesario. Según la memoria disponible y el tamaño del artefacto de modelo, un método heurístico calcula el número de trabajadores necesarios para ejecutarse dentro del contenedor personalizado. Los clientes también pueden sustituir la variable o transferir una variable de simultaneidad personalizada según sea necesario.
CONTAINER_TYPE Tipo de contenedor: TRITON. Solo se admite TRITON. Ninguna.