Transkriptionsjobs erstellen
Erstellen Sie einen Job, und leiten Sie ihn weiter, um eine oder mehrere Mediendateien in Textdateien im Speech-Service zu transkribieren.
Bevor Sie beginnen
-
Speichern Sie die Mediendateien, die Sie transkribieren möchten, in einem Object Storage-Bucket.
-
Informationen zum Vergleich der Whisper- und Oracle ASR-Modelle für die Erstellung von Transkriptionsjobs finden Sie unter Flüster- und Oracle ASR-Modelle vergleichen.
So erstellen Sie einen Transkriptionsjob: - Öffnen Sie das Navigationsmenü, und klicken Sie auf Analysen und KI. Klicken Sie unter KI-Services auf Sprache.
- Klicken Sie im linken Navigationsmenü auf Transkriptionsjobs.
- Wählen Sie unter Geltungsbereich auflisten das Compartment aus, in dem Sie arbeiten möchten.
- Klicken Sie auf Job erstellen.
-
Geben Sie auf der Basisinformationsseite einen eindeutigen Namen (maximal 255 Zeichen) für das Projekt ein. Der Name muss mindestens ein alphanumerisches Zeichen, Bindestriche oder Unterstriche in beliebiger Reihenfolge enthalten. Wenn Sie keinen Namen angeben, wird ein Name automatisch generiert.
Beispiele:
AiSpeechTranscriptionJob20220804134759
- (Optional) Geben Sie eine Beschreibung (mit maximal 400 Zeichen) für den Job ein.
- Wählen Sie das Compartment aus, in dem der Job erstellt werden soll, sofern es sich von dem angezeigten Compartment unterscheidet.
-
Wählen Sie unter Eingabe einen Dateneingabe-Bucket aus, der die Mediendatei enthält, die Sie transkribieren möchten.
Wenn sich der gewünschte Bucket nicht im ausgewählten Compartment befindet, ändern Sie das Compartment.
- Wählen Sie unter Ausgabe aus, wo die Ausgabedateien gespeichert werden sollen, entweder im Eingabe-Bucket oder in einem anderen Bucket. Um einen anderen Bucket zu verwenden, wählen Sie ihn aus.
- (Optional) Geben Sie ein Ausgabepräfix ein, um die Dateien im Bucket zu trennen und zu sortieren.
Beispiel: Sie können
call_ctr
für Call Center-Mediendateien eingeben.Sie können auch einen Ausgabeordner in Ihrem Bucket mit einem Schrägstrich (/) erstellen. Beispiel:
MyResults/
speichert alle transkribierten Dateien in einemMyResults
-Ordner im Bucket. -
Wählen Sie den Modelltyp des Jobs aus, den Sie erstellen.
Hinweis
Die unterstützten Modelltypen sind Oracle, Whisper Medium, Whisper Large V2 (auf Serviceanfrage) und Whisper Large V3 Turbo (neu). Informationen zum zu verwendenden Modelltyp finden Sie unter Flüster- und Oracle ASR-Modelle vergleichen. -
Wählen Sie die Sprache der Mediendatei aus.
Sie können die entsprechende Sprache nach Sprache suchen. Englisch (US-Englisch für ORACLE) ist der Standardwert.
Whisper-Modelle unterstützen die Sprachidentifizierung und können verwendet werden, indem auto als Sprachcode in der Dropdown-Liste ausgewählt wird.
- (Optional) Um sowohl das SRT- als auch das JSON-Format in die Transkription aufzunehmen, wählen Sie SRT-Transkriptionsformat abrufen aus.
-
Wenn Sie nicht möchten, dass Ihre Transkription unterbrochen wird, deaktivieren Sie Interpunktion aktivieren.
Hinweis
Interpunktion aktivieren ist für Whisper-Modelle ausgewählt und kann nicht gelöscht werden. - (Optional) Um die Lautsprecher in der Eingabedatei zu identifizieren, wählen Sie Diarisierung aktivieren aus.
Sie können den Sprachdienst automatisch die Anzahl der eindeutigen Lautsprecher in der Eingabedatei erkennen lassen oder eine Zahl eingeben. Die Mindestanzahl an Lautsprechern beträgt 2 und die maximale Anzahl 16.
Hinweis
Durch die Diarisierung wird die Latenzzeit der Transkriptionsaufgabe erhöht. Aus diesem Grund ist diese Option standardmäßig deaktiviert.
-
Um Filter hinzuzufügen, die das Generieren der Ausgabedatei ändern, klicken Sie auf Filter hinzufügen.
- Wählen Sie einen Filtertyp. Profanität ist die Standardeinstellung.
-
Wählen Sie den Filtermodus aus:
Beispiel: Der Profilfilter bietet folgende Modi:
-
Maske: Jede erkannte Ausführlichkeit wird in der Transkription mit Sternchen außer dem ersten Buchstaben maskiert.
-
Entfernen: Alle erkannten Fehler werden in der Transkription durch ein Sternchen ersetzt.
-
Tag: Profanity wird nicht maskiert oder entfernt, sondern in der Transkription als
TYPE: "Profanity"
markiert.
-
- (Optional) Um weitere Einstellungen hinzuzufügen, klicken Sie auf Weitere Einstellungen hinzufügen, und geben Sie einen Schlüssel und seinen Wert ein.
Beispiel:
- Schlüssel: Dies ist der Schlüsselwert, z.B. whisperPrompt.
Sie können beliebig viele Schlüssel hinzufügen. Um einen Schlüssel zu löschen, wählen Sie das X neben dem Feld Wert aus.
Wenn "Flüstermodell" ausgewählt ist, kann dieses Feld verwendet werden, um eine Eingabeaufforderung zur Unterstützung bei der Transkription zu übergeben. Der einzige unterstützte Schlüssel ist whisperPrompt. Wenn andere Schlüssel übergeben werden, verläuft die Anforderung nicht erfolgreich, da sie als ungültige Eingabe gilt.
Die maximale Länge der Werteingabeaufforderung beträgt 4000 Zeichen, lässt nur alphanumerische Zeichen und Satzzeichen (. , ! ? - : ; ' ") zu und ist spezifisch für Flüstern. Die Validierung wird im Hintergrund ausgeführt, und der Job ist nicht erfolgreich, wenn der Prompt diesen Grenzwert überschreitet.
- Wert: Dies ist ein Prompt-Wert und kann mehrere Wörter sein. Das Feld zeigt z.B. den gesamten eingegebenen Text an.
Hinweis
Das Hinzufügen eines Prompts zum Whisper-Modell kann zu unerwarteten Ergebnissen führen. - Schlüssel: Dies ist der Schlüsselwert, z.B. whisperPrompt.
- (Optional) Klicken Sie auf Erweiterte Optionen anzeigen, um dem Job Tags zuzuweisen. Mit Tags können Sie Ressourcen einfach finden und verfolgen, indem Sie einen Tag-Namespace auswählen und dann Schlüssel und Wert eingeben.
Unter Tagging werden die verschiedenen Tags beschrieben, mit denen Sie Ressourcen organisieren und suchen können, einschließlich Kostenverfolgungstags.
- Klicken Sie auf Weiter, um die Dateien für den Job auszuwählen.
-
Aktivieren Sie die Kontrollkästchen für die Mediendateien, die Sie transkribieren möchten, oder wählen Sie sie alle aus, indem Sie das Kontrollkästchen neben Name aktivieren.
Hinweis
-
Die maximale Dateigröße beträgt 2 GB.
-
Die Dateidauer beträgt maximal 4 Stunden.
-
-
Klicken Sie auf Weiterleiten, um den Job zu starten.
Ein Job kann je nach Größe und Anzahl der ausgewählten Dateien in Sekunden oder Stunden ausgeführt werden. Während der Ausführung befindet sich der Job in einem in Bearbeitung befindlichen Status, der sich nach Abschluss in "Erfolgreich" oder "Nicht erfolgreich" ändert. Sie können einen Job auswählen, um zur Detailseite zu gelangen.
Verwenden Sie den Befehl create und die erforderlichen Parameter, um einen Transkriptionsjob zu erstellen.
oci speech transcription-job create [OPTIONS]
Geben Sie dabei keine vertraulichen Informationen ein.
Eine vollständige Liste der Flags und Variablenoptionen für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.
Erstellen Sie einen Job mit den Vorgängen CreateTranscriptionJob und ChangeTranscriptionJobCompartment.