Puede supervisar los recursos de OCI Generative AI mediante las métricas proporcionadas en este servicio. También puede utilizar el servicio OCI Monitoring para crear consultas y alarmas personalizadas para notificarle cuando estas métricas cumplan los disparadores especificados por la alarma.
Alojamiento de métricas de cluster de IA dedicado
En esta sección, se muestran las métricas para los clusters de AI dedicados de hosting. Los clusters dedicados de ajuste fino no muestran métricas.
Nombre mostrado de la métrica
Descripción
Uso
La capacidad disponible para un cluster de AI dedicado se muestra como porcentaje a lo largo del tiempo
Número total de entrada
Número de tokens de entrada que los modelos de este cluster de AI dedicado de alojamiento han procesado
Número total de salida
Número de tokens de salida que los modelos de este cluster de AI dedicado de alojamiento han procesado
Puede crear consultas y alarmas personalizadas para las métricas de punto final y cluster de IA generativa mediante el servicio Monitoring.
En esta sección, se muestran los parámetros que puede utilizar para crear consultas personalizadas para métricas de IA generativa mediante el servicio Monitoring.
Parámetro de métrica
Nombre mostrado
Descripción
ClientErrorCount
Recuento de errores de cliente
Número de llamadas con errores del cliente
InputTokenCount
Número total de entrada
Número de tokens de entrada que los modelos alojados en este recurso han procesado
InvocationLatency
Tiempo total de procesamiento
Tiempo total de procesamiento para que una llamada termine en este recurso
OutputTokenCount
Número total de salida
Número de tokens de salida que los modelos alojados en este recurso han procesado