Esta página ha sido traducida por una máquina.

Métricas de despliegue de modelo

Obtenga información sobre cómo utilizar métricas para despliegues de modelos.

Las Métricas están disponibles automáticamente para cualquier despliegue de modelo de Data Science que cree en el espacio de nombre oci_datascience_modeldeploy. No es necesario que active la supervisión en los recursos de OCI para obtener estas métricas.

Las métricas de despliegues de modelo de Data Science incluyen estas dimensiones:

resourceId

OCID del despliegue del modelo.

statusCode

Código de estado de respuesta HTTP.

result

Resultado de la respuesta:

  • Success

  • Failure

statusFamily

Familia de estado del resultado:

  • Success: 2XX

  • Failure: 4XX and 5XX

instanceId

ID de la instancia.

networkType

Tipo de red:

  • BytesIn: Network receive throughput
  • BytesOut: Network transmission throughput

Nombre de métrica Nombre mostrado Unidad Descripción Dimensiones
PredictRequestCount Recuento de solicitudes previstas Recuento Número de solicitudes previstas.

resourceId

PredictResponse Ratio de éxito de predicción de respuesta Porcentaje Ratio de éxito de predicción de respuesta. Se calcula según el número de solicitudes de predicción correctas con respecto al número total de solicitudes de predicción.

resourceId

statusCode

result

statusFamily

Estado de predicción de respuesta Recuento Permite predecir el resultado de la respuesta y el código de estado.
PredictLatency Latencia prevista Milisegundos Latencia de llamadas previstas.

resourceId

result

PredictBandwidth Predecir uso de ancho de banda Porcentaje

Permite predecir el ancho de banda aprovisionado y el consumido. El ancho de banda aprovisionado es el ancho de banda esperado por el cliente definido durante la creación del despliegue del modelo. El ancho de banda consumido es el ancho de banda activo consumido por todas las solicitudes de predicción en curso para un OCID de despliegue de modelo específico. Este ancho de banda se calcula como el ancho de banda consumido actual en relación con el ancho de banda total aprovisionado del equilibrador de carga en cada solicitud de predicción.

resourceId

CpuUtilization Utilización de CPU Porcentaje Nivel de actividad de la CPU.

resourceId

instanceId

MemoryUtilization Utilización de memoria Porcentaje Memoria en uso.

resourceId

instanceId

NetworkBytes Bytes de recepción y transmisión de red Bytes/seg Rendimiento de transmisión y recepción de red.

resourceId

instanceId

networkType

GPUCoreUtilization Utilización de GPU Porcentaje Muestra el nivel de ocupación de los dispositivos GPU de un cluster de despliegue de modelo.

resourceId

instanceId

GPUMemoryUtilization Utilización de memoria de GPU Porcentaje Muestra el consumo de memoria medio de todos los dispositivos de GPU de un cluster de despliegue de modelo.

resourceId

instanceId

Visualización de métricas de despliegue de modelo

Puede ver los gráficos de métricas por defecto utilizando la página de detalles de un despliegue de modelo en el servicio Data Science.

  1. En la página despliegues de modelo, seleccione el nombre del despliegue de modelo para el que desea ver las métricas. Si necesita ayuda para buscar la lista de despliegues de modelo, consulte Listado de despliegues de modelo.
  2. En Recursos, seleccione Métricas.

    El área Métricas muestra un gráfico de cada métrica que se emite al espacio de nombre de métrica de Data Science.

Para obtener más información sobre las métricas emitidas, consulte Métricas de despliegue de modelo.

Si no se muestran los datos de métricas que esperaba de la sesión de despliegue de modelo, consulte la sección sobre los datos de métricas que faltan.