Metrikdetails in generativer KI

Sie können OCI Generative AI-Ressourcen über die in diesem Service bereitgestellten Metriken überwachen. Mit dem OCI Monitoring-Service können Sie auch benutzerdefinierte Abfragen und Alarme erstellen, um Sie zu benachrichtigen, wenn diese Metriken alarmspezifische Trigger erfüllen.

Hosting von Metriken für dedizierte KI-Cluster

In diesem Abschnitt werden die Metriken für die dedizierten Hosting-AI-Cluster aufgeführt. In den dedizierten Clustern für das Fine-Tuning werden keine Metriken angezeigt.


Anzeigename der Metrik	Beschreibung
Nutzung	Die verfügbare Kapazität für ein dediziertes AI-Cluster wird im Zeitverlauf als Prozentsatz angezeigt
Gesamtanzahl Eingabe	Anzahl der Eingabetoken, die von den Modellen auf diesem dedizierten AI-Hostcluster verarbeitet wurden
Gesamtanzahl Ausgaben	Anzahl der Ausgabetoken, die von den Modellen auf diesem dedizierten AI-Hostcluster verarbeitet wurden

Sie können die vorherigen Metriken von der Detailseite eines dedizierten KI-Clusters hosten abrufen.

Endpunktmetriken

In diesem Abschnitt werden die Metriken für Modellendpunkte in generativer KI aufgeführt.


Anzeigename der Metrik	Beschreibung
Gesamte Verarbeitungszeit	Gesamtverarbeitungszeit für Abschluss eines Aufrufs
Anzahl Aufrufe	Anzahl der Eingabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Anzahl Servicefehler	Anzahl der Aufrufe mit einem internen Servicefehler
Anzahl Clientfehler	Anzahl der Aufrufe mit einem clientseitigen Fehler
Gesamtanzahl Eingabe	Anzahl der Eingabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Gesamtanzahl Ausgaben	Anzahl der Ausgabetoken, die das auf diesem Endpunkt gehostete Modell verarbeitet hat
Erfolgsrate von Aufrufen	Erfolgreiche Anrufe geteilt durch die Gesamtanzahl der Anrufe

Sie können die vorherigen Metriken von der Detailseite eines Endpunkts abrufen.

Metriken für benutzerdefinierte Abfragen

Sie können benutzerdefinierte Abfragen und Alarme für das generative KI-Cluster und Endpunktmetriken über den Monitoring-Service erstellen.

In diesem Abschnitt werden die Parameter aufgeführt, mit denen Sie benutzerdefinierte Abfragen für generative KI-Metriken mit dem Monitoring-Service erstellen können.


Metrikparameter	Display Name	Beschreibung
`ClientErrorCount`	Anzahl Clientfehler	Anzahl der Aufrufe mit einem clientseitigen Fehler
`InputTokenCount`	Gesamtanzahl Eingabe	Anzahl der Eingabetoken, die von den auf dieser Ressource gehosteten Modellen verarbeitet wurden
`InvocationLatency`	Gesamte Verarbeitungszeit	Gesamtverarbeitungszeit für den Abschluss eines Aufrufs für diese Ressource
`OutputTokenCount`	Gesamtanzahl Ausgaben	Anzahl der Ausgabetoken, die von den auf dieser Ressource gehosteten Modellen verarbeitet wurden
`ServerErrorCount`	Anzahl Servicefehler	Anzahl der Aufrufe mit einem internen Servicefehler
`TotalInvocationCount`	Anzahl Aufrufe	Anzahl Aufrufe

Die Schritte zum Erstellen dieser benutzerdefinierten Abfragen finden Sie unter Abfrage für generative KI-Metriken erstellen.

Oracle Cloud Infrastructure-Dokumentation

Metrikdetails in generativer KI

Hosting von Metriken für dedizierte KI-Cluster

Endpunktmetriken

Metriken für benutzerdefinierte Abfragen