Texteinbettungen in generative KI erstellen
Verwenden Sie die Cohere-Einbettungsmodelle in OCI Generative AI, um Text zu Vektoreinbettungen zu konvertieren, die Sie in Anwendungen für semantische Suche, Textklassifizierung oder Text-Clustering verwenden können.
Die Eingabedaten für Texteinbettungen müssen folgende Anforderungen erfüllen:
- Sie können Sätze, Phrasen oder Absätze zum Einbetten entweder einzeln oder durch Hochladen einer Datei hinzufügen.
- Nur Dateien mit der Erweiterung
.txt
sind zulässig. - Wenn Sie eine Eingabedatei verwenden, müssen jeder Eingabesatz, jede Wortgruppe oder jeder Absatz in der Datei durch ein Zeilenvorschubzeichen getrennt werden.
- Für jede Ausführung sind maximal 96 Eingaben zulässig.
- In der Konsole muss jede Eingabe weniger als 512 Token für Nur-Text-Modelle enthalten.
- Wenn eine Eingabe zu lang ist, wählen Sie, ob der Anfang oder das Ende des Textes abgeschnitten werden soll, um innerhalb des Tokenlimits zu passen, indem Sie den Parameter Abschneiden auf Start oder Ende setzen. Wenn eine Eingabe den Tokengrenzwert von 512 überschreitet und der Parameter Abschneiden auf Kein Wert gesetzt ist, wird eine Fehlermeldung angezeigt.
- Für die Text- und Bildmodelle können Sie Dateien und Eingaben haben, die alle bis zu 128.000 Token hinzufügen.
- Für die Modelle zum Einbetten von Text und Bildern, wie Cohere Embed English Image V3, können Sie entweder Text hinzufügen oder nur ein Bild hinzufügen. Für das Image können Sie die API verwenden. Bildeingabe ist in der Konsole nicht verfügbar. Geben Sie für die API in jeder Ausführung ein base64-codiertes Image ein. Beispiel: Ein 512 x 512-Bild wird in etwa 1.610 Token konvertiert.
Um Einbettungen für Text zu erstellen, verwenden Sie den Vorgang embed-text-result.
Geben Sie den folgenden Befehl ein, um eine Liste mit Optionen zum Erstellen von Texteinbettungen anzuzeigen.
oci generative-ai-inference embed-text-result embed-text -h
Eine vollständige Liste der Parameter und Werte für die OCI Generative AI-CLI-Befehle finden Sie unter Generative AI Inference CLI und Generative AI Management CLI.
Führen Sie den Vorgang EmbedText aus, um Texteinbettungen zu erstellen.
Informationen zur Verwendung der API und zu Signieranforderungen finden Sie unter REST-API-Dokumentation und Sicherheitszugangsdaten. Informationen zu SDKs finden Sie unter SDKs und die CLI.