Metrikdetails in generativer KI

Sie können OCI Generative AI-Ressourcen über die in diesem Service bereitgestellten Metriken überwachen. Mit dem OCI Monitoring-Service können Sie auch benutzerdefinierte Abfragen und Alarme erstellen, um Sie zu benachrichtigen, wenn diese Metriken alarmspezifische Trigger erfüllen.

Hosting von Metriken für dedizierte KI-Cluster

In diesem Abschnitt werden die Metriken für die dedizierten Hosting-AI-Cluster aufgeführt. In den dedizierten Clustern für das Fine-Tuning werden keine Metriken angezeigt.

Anzeigename der Metrik Beschreibung
Nutzung Die verfügbare Kapazität für ein dediziertes AI-Cluster wird im Zeitverlauf als Prozentsatz angezeigt
Gesamtanzahl Eingabe Anzahl der Eingabetoken, die von den Modellen auf diesem dedizierten AI-Hostcluster verarbeitet wurden
Gesamtanzahl Ausgaben Anzahl der Ausgabetoken, die von den Modellen auf diesem dedizierten AI-Hostcluster verarbeitet wurden

Sie können die vorherigen Metriken von der Detailseite eines dedizierten KI-Clusters für das Hosting abrufen.

Endpunktmetriken

In diesem Abschnitt werden die Metriken für Modellendpunkte in generativer KI aufgeführt.

Anzeigename der Metrik Beschreibung
Gesamte Verarbeitungszeit Gesamtverarbeitungszeit für Abschluss eines Aufrufs
Anzahl Aufrufe Anzahl der Eingabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Anzahl Servicefehler Anzahl der Aufrufe mit einem internen Servicefehler
Anzahl Clientfehler Anzahl der Aufrufe mit einem clientseitigen Fehler
Gesamtanzahl Eingabe Anzahl der Eingabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Gesamtanzahl Ausgaben Anzahl der Ausgabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Erfolgsrate von Aufrufen Erfolgreiche Anrufe geteilt durch die Gesamtanzahl der Anrufe

Sie können die vorherigen Metriken von der Detailseite eines Endpunkts abrufen.

Metriken für benutzerdefinierte Abfragen

Sie können benutzerdefinierte Abfragen und Alarme für das generative KI-Cluster und Endpunktmetriken über den Monitoring-Service erstellen.

In diesem Abschnitt werden die Parameter aufgeführt, mit denen Sie benutzerdefinierte Abfragen für generative KI-Metriken mit dem Monitoring-Service erstellen können.

Metrikparameter Display Name Beschreibung
ClientErrorCount Anzahl Clientfehler Anzahl der Aufrufe mit einem clientseitigen Fehler
InputTokenCount Gesamtanzahl Eingabe Anzahl der Eingabetoken, die von den auf dieser Ressource gehosteten Modellen verarbeitet wurden
InvocationLatency Gesamte Verarbeitungszeit Gesamtverarbeitungszeit für den Abschluss eines Aufrufs für diese Ressource
OutputTokenCount Gesamtanzahl Ausgaben Anzahl der Ausgabetoken, die von den auf dieser Ressource gehosteten Modellen verarbeitet wurden
ServerErrorCount Anzahl Servicefehler Anzahl der Aufrufe mit einem internen Servicefehler
TotalInvocationCount Anzahl Aufrufe Anzahl Aufrufe

Die Schritte zum Erstellen dieser benutzerdefinierten Abfragen finden Sie unter Abfrage für generative KI-Metriken erstellen.