Solucione los problemas de los despliegues de modelos.
Depuración de un fallo de despliegue de modelo
Después de crear un nuevo despliegue o de actualizar un empleo existente, es posible que aparezca un fallo. En estos pasos se muestra cómo depurar la incidencia:
En la página inicial del proyecto, haga clic en Despliegues de modelo.
Seleccione el nombre del despliegue del modelo o haga clic en el menú Acciones del despliegue del modelo y seleccione Ver detalles. A continuación, compruebe las solicitudes de trabajo
En Recursos, seleccione Solicitud de trabajo.
Las solicitudes de trabajo aparecen en la parte inferior de la página.
En la página Información de solicitudes de trabajo, haga clic en Mensajes de log.
Si se producen fallos en los pasos de creación, en Recursos, seleccione Mensajes de error.
Si la solicitud de trabajo muestra que se ha realizado correctamente, revise los logs de predicción de OCI para identificar los errores.
Los Logs se asocian al despliegue del modelo cuando este se crea.
Si los registros están asociados, seleccione el nombre del registro de predicción para ver el registro.
Seleccione Explorar con búsqueda de log.
Cambie el tiempo del filtro para aumentar el período.
La ruta del entorno conda no es accesible 🔗
Asegúrese de que la ruta del entorno conda sea válida y de que ha configurado la política adecuada para un entorno conda publicado. La ruta del entorno conda debe seguir siendo válida y mantenerse accesible durante todo el ciclo de vida del despliegue del modelo para garantizar la disponibilidad y el funcionamiento adecuado del modelo desplegado.
Se ha producido un error al iniciar el servidor web 🔗
Active los logs de predicción de despliegue de modelo para ayudarle a depurar los errores. Por lo general, esto sucede cuando el código presenta incidencias o le faltan dependencias necesarias.
Llamada a un fallo de despliegue de modelo 🔗
Cuando un despliegue de modelo tiene un estado lifecycleState activo, se puede llamar al punto final de predicción. La respuesta de predicción puede devolver un fallo por muchos motivos. Utilice las siguientes sugerencias para intentar resolver estos errores:
Si las predicciones devuelven resultados diferentes (correctos, incorrectos) cada vez que se llama a la predicción para la misma entrada, es posible que los recursos asignados no sean suficientes para proporcionar la predicción del modelo. Puede editar el ancho de banda del equilibrador de carga para aumentarlo, así como el recuento de núcleos informáticos para servir más solicitudes en paralelo.
Demasiadas solicitudes (estado 429) 🔗
Si recibe este error al llamar al punto final de predicción, significa que las solicitudes se están limitando. Aumente el ancho de banda del equilibrador de carga del despliegue del modelo para solucionar este error. Puede calcular el ancho de banda utilizando el número esperado de solicitudes en segundos y el tamaño combinado de la solicitud y la carga útil de respuesta por solicitud.