Benutzerdefinierte Modelle erstellen

Document Understanding bietet eine Option zum Erstellen benutzerdefinierter Modelle, um Erkenntnisse aus Bildern zu extrahieren, ohne dass Data Scientists erforderlich sind.

Sie benötigen Folgendes, bevor Sie ein benutzerdefiniertes Modell erstellen:

  • Ein kostenpflichtiger Mandantenaccount in Oracle Cloud Infrastructure.
  • Vertrautheit mit Oracle Cloud Infrastructure Object Storage.
  • Die richtigen Policys wurden eingerichtet.

Trainieren Sie das Modell mit einem der benutzerdefinierten Modelltrainingsmodi von Document Understanding. Die Schulungsmodi sind:

  • Empfohlene Schulung: Document Understanding wählt automatisch die Schulungsdauer aus, um das beste Modell zu erstellen. Das Training kann bis zu 24 Stunden dauern.
  • Benutzerdefinierte Dauer: Mit dieser Option können Sie die maximale Trainingsdauer festlegen.

Die beste Trainingsdauer hängt von der Komplexität des Erkennungsproblems, der typischen Anzahl der Etiketten in einem Dokument, der Auflösung und anderen Faktoren ab. Berücksichtigen Sie diese Anforderungen, und weisen Sie mehr Zeit zu, wenn die Komplexität der Schulung zunimmt. Die empfohlene Mindestdauer beträgt 30 Minuten. Eine längere Trainingszeit gibt mehr Genauigkeit, gibt aber mit der Zeit abnehmende Renditen in der Genauigkeit. Verwenden Sie den empfohlenen Modus, um ein basenoptimiertes Modell abzurufen. Wenn Sie ein besseres Ergebnis wünschen, erhöhen Sie die Trainingszeit.

  • Sie benötigen ein Projekt, um ein Modell zu erstellen. Wenn Sie kein Projekt haben, finden Sie weitere Informationen unter Projekte erstellen.
    1. Wählen Sie auf der Seite "Projektdetails" die Option Modell erstellen aus. Wenn Sie Hilfe bei der Suche nach der Seite mit den Projektdetails benötigen, finden Sie weitere Informationen unter Projekte anzeigen.
    2. Wählen Sie den zu trainierenden Modelltyp aus. Entweder Dokumentklassifizierung oder Schlüsselwertextraktion.
      Eine Beschreibung dieser Typen finden Sie unter Informationen zu benutzerdefinierten Modellen.
    3. Wählen Sie die Trainingsdaten aus.
      • Wenn Sie keine Dokumente mit Anmerkungen haben, wählen Sie Neues Dataset erstellen aus. Sie gelangen zu Oracle Cloud Infrastructure Data Labeling, wo Sie dem Dokumentinhalt ganz einfach Labels hinzufügen können. Weitere Informationen zum Annotieren von Dokumenten in Data Labeling finden Sie im Abschnitt zum Etikettieren von Dokumenten.
      • Wenn Sie mit Anmerkungen versehene Dokumente haben, wählen Sie ein vorhandenes Dataset aus.
        • Wenn Sie das Dataset in Data Labeling mit Anmerkungen versehen haben, wählen Sie Data Labeling-Service aus.
        • Wenn Sie die Images mit einem Drittanbietertool kommentiert haben, wählen Sie Object Storage aus.
    4. Wählen Sie Weiter aus.
    5. Geben Sie einen Namen oder das benutzerdefinierte Modell ein.
    6. (Optional) Geben Sie dem Modell eine Beschreibung, mit der Sie es leichter finden können.
    7. Wählen Sie die Weiterbildungsdauer aus:
      • Empfohlene Schulung: Document Understanding wählt automatisch die Schulungsdauer aus, um das beste Modell zu erstellen. Das Training kann bis zu 24 Stunden dauern.
      • Benutzerdefiniert: Mit dieser Option können Sie die maximale Schulungsdauer (in Stunden) festlegen.
    8. Wählen Sie Weiter aus.
    9. Prüfen Sie die Informationen, die Sie in den vorherigen Schritten angegeben haben. Sie können Änderungen vornehmen, indem Sie Zurück auswählen.
    10. Wenn Sie mit dem Training des benutzerdefinierten Modells beginnen möchten, wählen Sie Erstellen und trainieren aus.
  • Verwenden Sie den Befehl create und die erforderlichen Parameter, um ein Modell zu erstellen:

    oci ai-document model create [OPTIONS]

    Eine vollständige Liste der Flags und Variablenoptionen für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.

  • Führen Sie den Vorgang CreateProject aus, um ein Projekt zu erstellen.

    Führen Sie den Vorgang CreateModel aus, um ein Modell zu erstellen.