Harvesting für Datenassets ausführen

Harvesting für ein Datenasset ausführen, um die Datenstrukturinformationen in Data Catalog zu extrahieren und die zugehörigen Datenentitys und Attribute anzuzeigen.

Um für ein Datenasset ein Harvesting auszuführen, müssen Sie mindestens eine Verbindung zum Datenasset erstellt haben.

    1. Klicken Sie auf der Registerkarte Home der Instanz, für die Sie ein Harvesting für ein Datenasset ausführen möchten, auf Datenassets.
    2. Klicken Sie auf der Seite Datenassets auf das Datenasset, für das Sie ein Harvesting ausführen möchten.
    3. Klicken Sie auf der Seite mit den Datenassetdetails auf Harvesting.
    4. Wählen Sie im Abschnitt Verbindung auswählen die gewünschte Verbindung aus, und klicken Sie auf Weiter.
      Hinweis

      Bei einem Objektspeicher-Datenasset können Sie mit der Schaltfläche Dateinamensmuster zuweisen dem ausgewählten Datenasset Dateinamensmuster zuweisen. Weitere Informationen finden Sie unter Datenassets Dateinamensmuster zuweisen.
    5. Zeigen Sie im Abschnitt Datenentitys auswählen alle Datenentitys, für die Sie ein Harvesting ausführen möchten, an, und fügen Sie sie aus der Tabelle der Datenentitys hinzu. Klicken Sie auf das Symbol "Hinzufügen" für jede Datenentity, die in den Harvesting-Job aufgenommen werden soll. Blenden Sie die Ordner der Datenentitys ein, um die verschachtelten Datenentitys anzuzeigen und sie aufzunehmen. Klicken Sie auf Alle hinzufügen, um alle Entitys für das Harvesting auszuwählen. Verwenden Sie das Feld Ordner/Datenobjekte filtern, um eine Datenentity in den verfügbaren Datenentitys zu suchen.
      Hinweis

      Es werden nur Ordner und Datenentitys aufgeführt, für die Sie Auswahl- oder Leseberechtigungen besitzen. Wenn Sie die gesuchten Datenentitys nicht finden, vergewissern Sie sich, dass Sie über die Zugriffsberechtigungen für diese Datenentitys in der Datenquelle verfügen.
    6. Prüfen Sie die Datenentitys, für die Sie ein Harvesting durchführen möchten, in der Tabelle der Datenentitys.
    7. (Optional) Klicken Sie auf das Symbol "Löschen" für alle ausgewählten Datenentitys, die Sie aus dem Harvesting-Job entfernen möchten. Wenn Sie noch einmal von vorne beginnen müssen, klicken Sie auf Alle entfernen.
      Hinweis

      Wenn bei Datenassets vom Typ "Oracle-Datenbank" oder "Autonome Datenbank" die Datenbankversion Oracle Database 12c oder höher ist, führt der Datenkatalog-Harvester kein Harvesting für die von Oracle verwalteten Schemas und andere allgemeine Benutzerschemas durch.
    8. Klicken Sie auf Weiter.
    9. Geben Sie auf der Registerkarte Job erstellen im Feld Jobname einen eindeutigen Namen ein, um den Harvesting-Job zu identifizieren.
    10. (Optional) Geben Sie eine Beschreibung ein.
    11. Aktivieren Sie das Kontrollkästchen Inkrementelles Harvesting, wenn bei nachfolgenden Ausführungen dieses Harvesting-Jobs nur Datenentitys erstellt werden sollen, die seit der ersten Ausführung des Harvesting-Jobs geändert wurden.
      Hinweis

      Inkrementelles Harvesting ist bei MySQL-, PostgreSQL-, Hive- und Kafka-Datenassets nicht möglich.
    12. Aktivieren Sie das Kontrollkästchen Nicht bekannte Dateien einschließen, wenn Data Catalog auch für nicht unterstützte Dateien ein Harvesting ausführen soll. Beispiel: .log, .txt, .sh, .jar und .pdf.
      Hinweis

      Wählen Sie die Option Nicht erkannte Dateien einschließen aus, um ein Harvesting für eine logische Datenentity auszuführen, die nur aus archivierten Dateien besteht.
    13. Wenn Sie für ein Oracle Object Storage-Datenasset ein Harvesting ausführen, aktivieren Sie das Kontrollkästchen Nur übereinstimmende Dateien einschließen, um nur für die Dateien zu sorgen, die mit den zugewiesenen Dateimustern übereinstimmen. Die anderen Dateinamensmuster werden ignoriert und der Anzahl übersprungener Dateisysteme hinzugefügt.
    14. Wählen Sie eine der folgenden Optionen aus, um die Ausführungszeit für den Harvesting-Job anzugeben:
      • Job jetzt ausführen: Erstellt einen Harvesting-Job und führt ihn sofort aus.
      • Joblauf planen: Zeigt weitere Felder zur Planung des Harvesting-Jobs an. Geben Sie einen Namen und eine Beschreibung für den Ausführungsplan ein. Geben Sie an, wie oft der Job ausgeführt werden soll. Die Optionen lauten stündlich, täglich, wöchentlich und monatlich. Wählen Sie den Anfang und das Ende für den Job aus.
      • Jobkonfigurationen für später speichern: Erstellt einen Harvesting-Job für das Data Asset, der Job wird jedoch nicht ausgeführt.
    15. Klicken Sie auf Job erstellen.

    Auf der Registerkarte Jobs können Sie den Status Ihres Jobs überwachen und Jobdetails anzeigen.

  • Verwenden Sie den Befehl create und die erforderlichen Parameter zum Harvesting von Datenentitys aus einem Datenasset:

    oci data-catalog job-definition create [OPTIONS]

    Eine vollständige Liste der Flags und Variablenoptionen für CLI-Befehle finden Sie in der CLI-Befehlsreferenz.

  • Führen Sie den Vorgang CreateJobDefinition aus, um ein Harvesting für das Datenasset auszuführen.