Zahlung für On-Demand-Inferenzierung
Sie erhalten die folgenden Vorteile durch das Festschreiben von On-Demand-Inferenzen in OCI Generative AI:
- Niedrige Barriere für die Nutzung generativer KI.
- Zugriff auf alle verfügbaren Grundmodelle für generative KI.
- Ideal zum Experimentieren und Auswerten der Modelle.
- Pay as you go für Transaktionen. Weitere Informationen finden Sie im folgenden Hinweis.
Wenn On-Demand inferenziert wird, zahlen Sie für die folgenden Zeichenlängen:
- Chat: Prompt-Länge (in Zeichen) + Antwortlänge (in Zeichen)
- Texteinbettungen: Eingabelänge (in Zeichen)
Auf der Seite Preise wird 1 character
als 1 transaction
berechnet.
Wenn Sie grundlegende Modelle hosten oder auf dedizierten KI-Clustern optimieren, werden Ihnen die Stunde und nicht die Transaktion in Rechnung gestellt. In diesem Fall wird unter Für dedizierte KI-Cluster bezahlen beschrieben, wie die dedizierten KI-Clusterkosten berechnet werden.
Modelle mit On-Demand-Preisen abgleichen
Auf der Preisseite wird der Preis für 10.000 On-Demand-Transaktionen aufgeführt, wenn der Playground, die API oder die CLI für Inferenzen verwendet werden.
Gehen Sie zur Seite vorgeschulte Modelle, und wählen Sie das Modell aus, mit dem Sie arbeiten möchten. Suchen Sie im Abschnitt On-Demand-Modus die Informationen zur Preisseite für das Modell. Lesen Sie anschließend die Beispiele in diesem Abschnitt, um zu erfahren, wie Sie die Kosten basierend auf der Anzahl der Eingabe- und Ausgabezeichen berechnen.
Chatbeispiel
Paul ruft das Modell meta.llama-3.3-70b-instruct
mit der folgenden Eingabeaufforderung auf, die 220 characters
lang ist:
Generieren Sie eine Produktneigung für ein an USB angeschlossenes kompaktes Mikrofon, das Surround-Sound aufnehmen kann. Das Mikrofon ist am nützlichsten bei der Aufnahme von Musik oder Gesprächen. Das Mikrofon kann auch für die Aufzeichnung von Podcasts nützlich sein.
Die Antwort vom Modell ist 2,205 characters
lang. Paul will die Kosten für diesen Aufruf wissen. Hier sind die Schritte zur Berechnung der Kosten.
Neben der Preisberechnung können Sie die Kosten schätzen, indem Sie die Kategorie KI und maschinelles Lernen auswählen und den Kostenrechner für OCI Generative AI laden.
Beispiel für Texteinbettungen
Gina wandelt Kundenverträge in Einbettungen für eine neue semantische Suchanwendung um. Im Durchschnitt nimmt Gina 16 Dokumente pro Stunde auf. Jedes Dokument ist etwa 1,000 characters
lang. Gina möchte eine Schätzung der monatlichen Rechnung für die Generierung dieser Einbettungen erhalten. So berechnen Sie die Kosten: