Métricas de despliegue de modelo
Obtenga información sobre cómo utilizar métricas para despliegues de modelos.
Las Métricas están disponibles automáticamente para cualquier despliegue de modelo de Data Science que cree en el espacio de nombre oci_datascience_modeldeploy
. No es necesario que active la supervisión en los recursos de OCI para obtener estas métricas.
Las métricas de despliegues de modelo de Data Science incluyen estas dimensiones:
- resourceId
-
OCID del despliegue del modelo.
- statusCode
-
Código de estado de respuesta HTTP.
- result
-
Resultado de la respuesta:
-
Success
-
Failure
-
- statusFamily
-
Familia de estado del resultado:
-
Success: 2XX
-
Failure: 4XX and 5XX
-
- instanceId
-
ID de la instancia.
- networkType
-
Tipo de red:
BytesIn: Network receive throughput
-
BytesOut: Network transmission throughput
Nombre de métrica | Nombre mostrado | Unidad | Descripción | Dimensiones |
---|---|---|---|---|
PredictRequestCount |
Recuento de solicitudes previstas | Recuento | Número de solicitudes previstas. |
|
PredictResponse |
Ratio de éxito de predicción de respuesta | Porcentaje | Ratio de éxito de predicción de respuesta. Se calcula según el número de solicitudes de predicción correctas con respecto al número total de solicitudes de predicción. |
|
Estado de predicción de respuesta | Recuento | Permite predecir el resultado de la respuesta y el código de estado. | ||
PredictLatency |
Latencia prevista | Milisegundos | Latencia de llamadas previstas. |
|
PredictBandwidth |
Predecir uso de ancho de banda | Porcentaje |
Permite predecir el ancho de banda aprovisionado y el consumido. El ancho de banda aprovisionado es el ancho de banda esperado por el cliente definido durante la creación del despliegue del modelo. El ancho de banda consumido es el ancho de banda activo consumido por todas las solicitudes de predicción en curso para un OCID de despliegue de modelo específico. Este ancho de banda se calcula como el ancho de banda consumido actual en relación con el ancho de banda total aprovisionado del equilibrador de carga en cada solicitud de predicción. |
|
CpuUtilization |
Utilización de CPU | Porcentaje | Nivel de actividad de la CPU. |
|
MemoryUtilization |
Utilización de memoria | Porcentaje | Memoria en uso. |
|
NetworkBytes |
Bytes de recepción y transmisión de red | Bytes/seg | Rendimiento de transmisión y recepción de red. |
|
GPUCoreUtilization |
Utilización de GPU | Porcentaje | Muestra el nivel de ocupación de los dispositivos GPU de un cluster de despliegue de modelo. |
|
GPUMemoryUtilization |
Utilización de memoria de GPU | Porcentaje | Muestra el consumo de memoria medio de todos los dispositivos de GPU de un cluster de despliegue de modelo. |
|
Visualización de métricas de despliegue de modelo
Puede ver los gráficos de métricas por defecto utilizando la página de detalles de un despliegue de modelo en el servicio Data Science.
Para obtener más información sobre las métricas emitidas, consulte Métricas de despliegue de modelo.
Si no se muestran los datos de métricas que esperaba de la sesión de despliegue de modelo, consulte la sección sobre los datos de métricas que faltan.