ディレクトリへのParquetとしてのデータのエクスポート

問合せを指定して、Autonomous DatabaseからParquetデータとしてディレクトリに表データをエクスポートするステップを示します。

  1. Autonomous Databaseインスタンスに接続します。

    詳細は、Autonomous Databaseへの接続を参照してください。

  2. ディレクトリの作成

    たとえば:

    CREATE DIRECTORY export_dir AS 'export_dir';
    詳細は、Autonomous Databaseでのディレクトリの作成を参照してください。
  3. DBMS_CLOUD.EXPORT_DATAを実行し、formatパラメータのtypeに値jsonを指定して、結果をParquetファイルとしてディレクトリにエクスポートします。出力をディレクトリに送信する場合は、credentialパラメータを含めないでください。
    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => 'export_dir:sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    ディレクトリ名が二重引用符で囲まれている場合、ディレクトリ名では大文字と小文字が区別されます。たとえば:

    BEGIN
     DBMS_CLOUD.EXPORT_DATA(
        file_uri_list => '"export_dir":sales.parquet',
        format => JSON_OBJECT('type' value 'parquet'),
        query => 'SELECT * FROM sales'
     );
    END;
    /
    

    パラメータの詳細は、EXPORT_DATAプロシージャを参照してください。

    DBMS_CLOUD.EXPORT_DATAで使用できるformatパラメータの詳細は、DBMS_CLOUD EXPORT_DATAのパッケージ・フォーマット・オプションを参照してください。

    パラメータは次のとおりです:

    • file_uri_list: エクスポート・ファイルのカンマ区切りリストです。file_uri_listでは、ワイルドカードおよび置換文字の使用はサポートされていません。

    • format: 必要なtypeパラメータを指定します。有効な値はdatapumpjsonxmlcsvおよびparquetで、ORACLE_DATAPUMPアクセス・ドライバを使用してエクスポートに指定できるオプションもオプションで定義します。

    • query: 必要なデータのみがエクスポートされるようにSELECT文を指定します。問合せによってダンプ・ファイルの内容が決定されます。

    パラメータの詳細は、EXPORT_DATAプロシージャを参照してください。

DBMS_CLOUD.EXPORT_DATAを使用したエクスポートに関するノート:

  • 指定するqueryパラメータは、必要に応じて、結合や副問合せを含む問合せなどの拡張問合せにすることができます。

  • 出力ファイルを圧縮するには、formatパラメータにcompressionオプションを指定します。

  • OracleタイプからParquetタイプへのマッピングの詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    次の型はサポートされていないか、またはDBMS_CLOUD.EXPORT_DATAを使用したParquetのエクスポートのサポートに制限があります:

    Oracleタイプ ノート

    BFILE

    はサポートされていません

    BLOB

    はサポートされていません

    DATE

    DATE形式では、日付、月および年のみがサポートされます。時間、分、秒はサポートされていません。

    DATEをParquetにエクスポートするためのNLS形式の制限の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。

    INTERVAL DAY TO SECOND

    サポートされ、内部で文字列として処理されます。

    INTERVAL YEAR TO MONTH

    サポートされ、内部で文字列として処理されます。

    LONG

    はサポートされていません

    LONG RAW

    はサポートされていません

    NUMBER

    サポートされる制限は次のとおりです。

    • 最大精度を38に設定し、精度以下にスケーリングできます。
    • 列のNUMBER型に精度とスケールが指定されていない場合は、デフォルトで38の精度と20のスケールが使用されます。
    • 負のスケールは、NUMBER型ではサポートされていません。

    Object Types

    はサポートされていません

    TIMESTAMP

    サポートされる制限は次のとおりです。

    • 精度が異なる複数の列がある場合、最高精度が使用されます。
    • TIMESTAMP WITH TIME ZONE Oracleデータ型では、タイムスタンプのみが使用されます。

    TIMESTAMPをParquetにエクスポートするためのNLS形式の制限の詳細は、DBMS_CLOUD「Oracleデータ型からParquetへのマッピングのパッケージ」を参照してください。