Métricas de despliegue de modelo

Obtenga información sobre cómo utilizar métricas para despliegues de modelos.

Las Métricas están disponibles automáticamente para cualquier despliegue de modelo de Data Science que cree en el espacio de nombre oci_datascience_modeldeploy. No es necesario que active la supervisión en los recursos de OCI para obtener estas métricas.

Las métricas de despliegues de modelo de Data Science incluyen estas dimensiones:

resourceId

OCID del despliegue del modelo.

statusCode

Código de estado de respuesta HTTP.

result

Resultado de la respuesta:

Success
Failure

statusFamily

Familia de estado del resultado:

Success: 2XX
Failure: 4XX and 5XX

instanceId

ID de la instancia.

networkType

Tipo de red:

BytesIn: Network receive throughput
BytesOut: Network transmission throughput


Nombre de métrica	Nombre mostrado	Unidad	Descripción	Dimensiones
`PredictRequestCount`	Recuento de solicitudes previstas	Recuento	Número de solicitudes previstas.	`resourceId`
`PredictResponse`	Ratio de éxito de predicción de respuesta	Porcentaje	Ratio de éxito de predicción de respuesta. Se calcula según el número de solicitudes de predicción correctas con respecto al número total de solicitudes de predicción.	`resourceId` `statusCode` `result` `statusFamily`
`PredictResponse`	Estado de predicción de respuesta	Recuento	Permite predecir el resultado de la respuesta y el código de estado.	`resourceId` `statusCode` `result` `statusFamily`
`PredictLatency`	Latencia prevista	Milisegundos	Latencia de llamadas previstas.	`resourceId` `result`
`PredictBandwidth`	Predecir uso de ancho de banda	Porcentaje	Permite predecir el ancho de banda aprovisionado y el consumido. El ancho de banda aprovisionado es el ancho de banda esperado por el cliente definido durante la creación del despliegue del modelo. El ancho de banda consumido es el ancho de banda activo consumido por todas las solicitudes de predicción en curso para un OCID de despliegue de modelo específico. Este ancho de banda se calcula como el ancho de banda consumido actual en relación con el ancho de banda total aprovisionado del equilibrador de carga en cada solicitud de predicción.	`resourceId`
`CpuUtilization`	Utilización de CPU	Porcentaje	Nivel de actividad de la CPU.	`resourceId` `instanceId`
`MemoryUtilization`	Utilización de memoria	Porcentaje	Memoria en uso.	`resourceId` `instanceId`
`NetworkBytes`	Bytes de recepción y transmisión de red	Bytes/seg	Rendimiento de transmisión y recepción de red.	`resourceId` `instanceId` `networkType`
`GPUCoreUtilization`	Utilización de GPU	Porcentaje	Muestra el nivel de ocupación de los dispositivos GPU de un cluster de despliegue de modelo.	`resourceId` `instanceId`
`GPUMemoryUtilization`	Utilización de memoria de GPU	Porcentaje	Muestra el consumo de memoria medio de todos los dispositivos de GPU de un cluster de despliegue de modelo.	`resourceId` `instanceId`

Visualización de métricas de despliegue de modelo

Puede ver los gráficos de métricas por defecto utilizando la página de detalles de un despliegue de modelo en el servicio Data Science.

En la página despliegues de modelo, seleccione el nombre del despliegue de modelo para el que desea ver las métricas. Si necesita ayuda para buscar la lista de despliegues de modelo, consulte Listado de despliegues de modelo.
En Recursos, seleccione Métricas.

El área Métricas muestra un gráfico de cada métrica que se emite al espacio de nombre de métrica de Data Science.

Para obtener más información sobre las métricas emitidas, consulte Métricas de despliegue de modelo.

Si no se muestran los datos de métricas que esperaba de la sesión de despliegue de modelo, consulte la sección sobre los datos de métricas que faltan.

Documentación de Oracle Cloud Infrastructure Probar cuenta gratuita

Métricas de despliegue de modelo

Visualización de métricas de despliegue de modelo 🔗

Documentación de Oracle Cloud Infrastructure
Probar cuenta gratuita

Visualización de métricas de despliegue de modelo