Por ejemplo:
BEGIN DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
(
table_name => 'MYSALES',
credential_name => 'DEF_CRED_NAME',
file_uri_list => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname/o/sales/*.parquet',
format =>
json_object('type' value 'parquet', 'schema' value 'first',
'partition_columns' value
json_array(
json_object('name' value 'country', 'type' value 'varchar2(100)'),
json_object('name' value 'year', 'type' value 'number'),
json_object('name' value 'month', 'type' value 'varchar2(2)')
)
)
);
END;
/
Los parámetros DBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
para los archivos de datos estructurados, como para un archivo de datos Parquet, no necesitan los parámetros column_list
o field_list
. Los nombres de columna y los tipos de dato se derivan para las columnas del primer archivo de parquet que el procedimiento explora (y, por lo tanto, todos los archivos deben tener la misma unidad). La lista de columnas generadas incluye las columnas derivadas del nombre de objeto y estas columnas tienen los tipos de dato especificados con el parámetro partition_columns
format
.
Los parámetros son:
-
table_name
: es el nombre de la tabla externa.
-
credential_name
: es el nombre de la credencial creada en el paso anterior.
-
file_uri_list
: es una lista delimitada por comas de los URI de archivo de origen. Para esta lista existen dos opciones:
-
Especifique una lista delimitada por comas de URI de archivos individuales sin comodines.
-
Especifique un único URI de archivo con comodines, donde los comodines solo pueden ser posteriores a la última barra diagonal "/". Se puede utilizar el carácter "*" como comodín para varios caracteres; el carácter "?" se puede utilizar como comodín para un solo carácter.
-
column_list
: es una lista delimitada por comas de nombres de columna y tipos del dato para la tabla externa. La lista incluye las columnas que se encuentran dentro del archivo, así como las derivadas del nombre del objeto.
column_list
no es necesario cuando los archivos de datos son archivos estructurados (Parquet, Avro u ORC).
-
field_list
: identifica los campos en los archivos de origen y sus tipos de datos. El valor por defecto es NULL
, que significa que los campos y sus tipos del dato están determinados por el parámetro column_list
.
field_list
no es necesario cuando los archivos de datos son archivos estructurados (Parquet, Avro u ORC).
-
format
: define las opciones que puede especificar para describir el formato del archivo de origen. El parámetro partition_columns
format
especifica los nombres de las columnas de partición. Consulte DBMS_CLOUD Package Format Options para obtener más información.
Si los datos del archivo de origen están cifrados, descifre los datos especificando la opción de formato encryption
. Consulte Descifrar datos al importar desde Object Storage para obtener más información sobre el descifrado de datos.
En este ejemplo, namespace-string
es el espacio Oracle Cloud Infrastructure Object Storage Namepace, y bucketname
es el nombre del cubo. Consulte Descripción de los espacios de nombres de Object Storage para obtener más información.
Consulte el procedimiento CREATE_EXTERNAL_PART_TABLE para obtener información detallada sobre los parámetros.
Consulte DBMS_CLOUD URI Formats para obtener más información sobre los servicios de almacenamiento de objetos en la nube soportados.
Si hay filas en los archivos de origen que no coincidan con las opciones de formato que ha especificado, la consulta informa de un error. Puede utilizar parámetros DBMS_CLOUD
, como rejectlimit
, para suprimir estos errores. Como alternativa, también puede validar la tabla particionada externa que ha creado para ver los mensajes de error y las filas rechazadas de modo que pueda cambiar la opción de formato según corresponda. Consulte Validación de datos externos y Validación de datos externos particionados para más información.