Variables de entorno de despliegue de modelo
Al crear un recurso de despliegue de modelo, puede proporcionar variables de entorno personalizadas como parte de la configuración por defecto. Estas variables de entorno están disponibles para su uso dentro del contenedor en tiempo de ejecución.
Restricción de formato
- La clave debe tener menos de 32 caracteres.
- La clave debe contener solo letras, dígitos y guiones bajos (_).
- La clave debe comenzar con una letra.
- La clave debe tener al menos 2 caracteres.
- La clave no debe terminar con el guion bajo. Por ejemplo, TEST_.
- La clave, si se agrega, no puede estar vacía. El valor puede estar vacío.
- El valor puede ser cualquier carácter.
- La clave no puede ser variables de entorno proporcionadas por el servicio.
- Si los puertos se transfieren como una variable de entorno, limítelos entre 1024 y 65535 y excluya también los puertos 24224, 8446 y 8447.
Restricción de tamaño
Los valores individuales no tienen límites de tamaño específicos. Las variables de entorno generales, incluidos los pares clave-valor, están limitadas a 2048 bytes. Si el tamaño es superior a 2048 bytes, especifique las variables de entorno mediante el artefacto de modelo o utilice OCI Object Storage para extraer los datos.
Variables de entorno proporcionadas por el servicio
El servicio tiene variables de entorno reservadas dentro del contenedor en tiempo de ejecución para el registro u otro uso funcional. Estas variables de entorno no se pueden sustituir.
Nombre | Contenedor personalizado | Contenedor por defecto |
---|---|---|
MODEL_DEPLOYMENT_OCID |
OCID de recurso de despliegue de modelo. | OCID de recurso de despliegue de modelo. |
MODEL_SERVING_PYTHON_VERSION |
Ninguna. | Versión de Python de runtime.yaml utilizada para servir modelos. |
TENANCY_OCID |
OCID de arrendamiento. | OCID de arrendamiento. |
CONTAINER_CUSTOM_IMAGE |
Ruta de imagen de contenedor (con etiqueta o resumen) que se proporciona mediante el objeto de configuración de entorno de API. | Ninguna. |
Variables de entorno de aplicación
Estas variables de entorno controlan funcionalmente cómo se crea el despliegue del modelo y los clientes pueden sustituirlo o configurarlo transfiriendo la configuración por defecto.
Nombre | Contenedor personalizado | Contenedor gestionado |
---|---|---|
WEB_CONCURRENCY |
Según la memoria disponible y el tamaño del artefacto de modelo, un método heurístico calcula el número de trabajadores necesarios para ejecutarse dentro del contenedor personalizado. Los clientes también pueden sustituir la variable o transferir una variable de simultaneidad personalizada según sea necesario. | Según la memoria disponible y el tamaño del artefacto de modelo, un método heurístico calcula el número de trabajadores necesarios para ejecutarse dentro del contenedor personalizado. Los clientes también pueden sustituir la variable o transferir una variable de simultaneidad personalizada según sea necesario. |
CONTAINER_TYPE |
Tipo de contenedor: TRITON. Solo se admite TRITON. | Ninguna. |