Consultar datos externos con base de datos de IA autónoma
Describe paquetes y herramientas para consultar y validar datos con Autonomous AI Database.
La base de datos no gestiona los datos externos; sin embargo, puede utilizar el procedimiento DBMS_CLOUD
para consultar los datos externos. Aunque las consultas de datos externos no serán tan rápidas como las consultas de tablas de base de datos, puede utilizar este enfoque para empezar rápidamente a ejecutar consultas en los archivos de origen externos y los datos externos. Según el tipo de tabla externa, puede validar los datos externos mediante los procedimientos de validación DBMS_CLOUD
. Los procedimientos de validación de datos le permiten validar los archivos de origen para una tabla externa para poder identificar problemas y corregir los datos de la tabla externa o excluir datos no válidos antes de utilizar los datos.
Si no utiliza el usuario
ADMIN
, asegúrese de que el usuario tiene los privilegios necesarios para las operaciones que debe realizar el usuario. Consulte Gestión de privilegios de usuario en Autonomous AI Database - Conexión con una herramienta de cliente para obtener más información.
- Consulta de Datos Externos
Para consultar datos en archivos en la nube, primero se deben almacenar las credenciales del almacenamiento de objeto en la base de Datos de IA autónoma y, a continuación, crear una tabla externa mediante el procedimiento PL/SQLDBMS_CLOUD.CREATE_EXTERNAL_TABLE
- Consulta de datos externos con archivos de origen ORC, Parquet o Avro
La base de datos de IA autónoma facilita el acceso a los datos de ORC, Parquet o Avro almacenados en el almacén de objetos mediante tablas externas. Los orígenes ORC, Parquet y Avro tienen metadatos embebidos en ellos, y el procedimientoDBMS_CLOUD.CREATE_EXTERNAL_TABLE
puede utilizar estos metadatos para simplificar la creación de tablas externas. - Consulta de tablas externas con partición implícita
En Autonomous AI Database puede crear tablas externas particionadas implícitas a partir de datos particionados de estilo Hive o de datos particionados de carpetas simples almacenados en el almacén de objetos en la nube. - Consulta de Tablas Externas con Partición Especificada en Archivos de Origen
Si desea consultar varios archivos de datos en el almacén de objetos como una única tabla externa y los archivos se pueden representar como varias particiones lógicas, se recomienda utilizar una tabla particionada externa. El uso de una tabla particionada externa conserva la partición lógica de los archivos de datos para el acceso a las consultas. - Consulta de Datos Particionados Externos (con Cláusula de Partición)
Si desea consultar varios archivos de datos en el almacén de objetos como una única tabla externa y los archivos se pueden representar como varias particiones lógicas, se recomienda utilizar una tabla particionada externa. El uso de una tabla particionada externa conserva la partición lógica de los archivos de datos para el acceso a las consultas. Utilice el procedimientoDBMS_CLOUD.CREATE_EXTERNAL_PART_TABLE
para crear una tabla particionada externa. - Datos de consulta que utilizan el origen de hiperenlace de tabla
Puede crear una tabla externa a través de un hiperenlace de tabla de base de datos de IA autónoma. - Consulta de Datos Particionados Híbridos
Si desea consultar datos internos y varios archivos de datos en el almacén de objetos como tabla lógica única, puede utilizar una tabla particionada híbrida para representar los datos como un único objeto. Utilice el procedimientoDBMS_CLOUD.CREATE_HYBRID_PART_TABLE
para crear una tabla particionada híbrida. - Consulta de archivos de volcado de pump de datos externo
También puede consultar archivos de volcado de Oracle Data Pump en la nube creando una tabla externa medianteDBMS_CLOUD.CREATE_EXTERNAL_TABLE
. - Consulta de datos de Hadoop (HDFS) de Big Data Service desde una base de datos de IA autónoma
Puede crear enlaces de base de datos a Oracle Big Data Service desde una base de datos de IA autónoma. - Consulta de datos externos con Data Catalog
Oracle Cloud Infrastructure Data Catalog es el servicio de gestión de metadatos para Oracle Cloud que le ayuda a detectar datos y a soportar la gobernanza de datos. Proporciona un inventario de activos, un glosario de negocio y un metastore común para lagos de datos. - Consulta de datos externos con AWS Glue Data Catalog
La base de datos de IA autónoma admite un sistema para sincronizar con una instancia de Amazon AWS Glue Data Catalog. - Consulta de tablas de Apache Iceberg
La base de datos de IA autónoma admite la consulta de tablas de Apache Iceberg. - Validación de datos externos
Para validar cualquier tabla externa, puede utilizar el procedimientoDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
. - Validación de datos particionados externos
Para validar una tabla particionada externa, puede utilizar el procedimientoDBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
. Este procedimiento incluye un parámetro que le permite especificar una partición específica para validar. - Validación de datos particionados híbridos
Para validar una tabla particionada híbrida, puede utilizar el procedimientoDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
. Este procedimiento incluye un parámetro que le permite especificar una partición específica para validar. - Visualización de logs para validación de datos
Para validar una tabla externa, utilice los procedimientosDBMS_CLOUD.VALIDATE_EXTERNAL_TABLE
,DBMS_CLOUD.VALIDATE_EXTERNAL_PART_TABLE
yDBMS_CLOUD.VALIDATE_HYBRID_PART_TABLE
.
Tema principal: Enlazar datos