Recopilación desde Oracle Object Storage

La recogida es un proceso mediante el cual se extraen metadatos técnicos de los activos de datos presentes en el catálogo de datos. Un activo de datos representa un origen de datos. Por ejemplo: una base de datos, un almacén de objetos, un almacén de archivos o documentos, una cola de mensajes o una aplicación.

En este tutorial:

  1. Permitirá a Data Catalog acceder a cualquier objeto de Oracle Object Storage, en cualquier cubo, en cualquier compartimento dentro del arrendamiento donde se crea la política.
  2. Creará un activo de datos de Oracle Object Storage.
  3. Agregará una conexión por defecto para el activo de datos.
  4. Recogerá el activo de datos ejecutando el trabajo de recogida inmediatamente.
Importante

Puede recoger archivos de Object Storage como entidades de datos lógicas.

Antes de empezar

Para realizar correctamente este tutorial, debe tener lo siguiente:

1. Creación de una política de acceso

Cree una política para permitir que Data Catalog acceda a sus recursos de Object Storage.

Como mínimo, debe tener el permiso READ para todos los tipos de recurso individuales objectstorage-namespaces, buckets y objects, o para el tipo de recurso agregado de Object Storage object-family.

Para crear una política de acceso a fin de otorgar el permiso READ al tipo de recurso agregado de Object Storage object-family, realice los siguientes pasos:

  1. Abra el menú de navegación y seleccione Identidad y seguridad. En Identidad, seleccione Políticas.
  2. En la página Políticas, haga clic en Crear política.
  3. En el panel Crear política, introduzca los siguientes detalles:
    • Nombre: introduzca un nombre único para la política. El nombre debe ser único en todas las políticas de su arrendamiento. No puede cambiar el nombre más adelante. Por ejemplo, data-catalog-dynamic-group.
    • Descripción: introduzca una descripción, como Otorgar acceso a recursos de almacenamiento de objetos en cualquier compartimento del arrendamiento.
    • Compartimento: seleccione el compartimento en el que desea crear la política.
    • Creador de política: en esta sección, mueva el control deslizante a Mostrar editor manual e introduzca la regla de política. Por ejemplo, para el grupo dinámico catalog-dynamic-group, introduzca la siguiente regla de política:
      allow dynamic-group data-catalog-dynamic-group to read object-family in tenancy
      Nota

      Esta política permite el acceso a cualquier objeto, en cualquier cubo, en cualquier compartimento dentro del arrendamiento donde se crea la política. Para obtener más ejemplos, consulte Ejemplos de políticas.
  4. Haga clic en Crear.
Ha creado correctamente la política para permitir que Data Catalog acceda a todos los recursos de Oracle Object Storage.

2. Creación de un activo de datos

Ya está listo para registrar los orígenes de datos de Oracle Object Storage con Data Catalog como un activo de datos .

Para crear un activo de datos de Oracle Object Storage, realice los siguientes pasos:

  1. Abra el menú de navegación y seleccione Análisis e IA. En Lago , seleccione Data Catalog.
  2. Haga clic en la instancia de Data Catalog en la que desea crear el activo de datos.
  3. En la página inicial de la instancia de Data Catalog, haga clic en Create Data Asset en el mosaico Quick Actions.
    Nota

    Después de crear una instancia de Data Catalog, al acceder al separador Inicio por primera vez, se mostrará el botón Crear activo de datos en el mosaico Activos de datos.
  4. En el panel Crear activo de datos, introduzca los detalles como se describe en la siguiente tabla:
    Campo Descripción
    Nombre

    Introduzca un nombre para identificar de forma única el activo de datos. Puede editar el nombre más tarde.

    No puede utilizar los siguientes caracteres especiales en el nombre:

    & < > " ' / \ = ;

    Nombre es un campo que permite la búsqueda en Data Catalog.

    Descripción Especifique la necesidad o la finalidad de crear este activo de datos.
    Tipo Seleccione Oracle Object Storage.
    URL Introduzca el URI de swift para el recurso de Oracle Object Storage con el siguiente formato: https://swiftobjectstorage.<region-identifier>.oraclecloud.com

    Por ejemplo:

    https://swiftobjectstorage.us-phoenix-1.oraclecloud.com/
    Espacio de nombres Introduzca el espacio de nombres de almacenamiento de objetos para el recurso de Oracle Cloud Infrastructure Object Storage especificado.

    Para ver la cadena del espacio de nombres de Object Storage en la consola, en el menú Profile, haga clic en Tenancy:<your_tenancy_name>. El espacio de nombres aparece en Configuración de almacenamiento de objetos.

  5. Haga clic en Crear.
Se ha creado correctamente un activo de datos de Oracle Object Storage.

3. Adición de una conexión

Después de crear el activo de datos de Oracle Object Storage, cree una conexión para el activo de datos.

Para agregar una conexión para el activo de datos de Oracle Object Storage, siga estos pasos:

  1. En el separador Inicio, haga clic en Activos de datos.
  2. En la lista Activos de datos, seleccione el activo de datos de Oracle Object Storage que ha creado.
  3. En el separador Resumen de la página de detalles del activo de datos, en Información de conexión, haga clic en Agregar conexión.
  4. En el panel Agregar conexión, introduzca los detalles como se describe en la siguiente tabla:
    Campo Descripción
    Nombre Introduzca un nombre único para la conexión.
    Descripción Introduzca una descripción breve para la conexión.
    Tipo Seleccione una de las siguientes opciones:
    • Principal de recursos: la entidad de recurso es el tipo de conexión recomendado. Antes de crear una conexión Resource Principal para el activo de datos de Oracle Object Storage, debe crear una política que permita que Data Catalog acceda al recurso de Object Storage.
    • Solicitud autenticada previamente: seleccione este tipo de conexión para recopilar un cubo de almacenamiento de objetos público o privado al que tenga acceso mediante una solicitud autenticada previamente. Al seleccionar este tipo de conexión, aparece el campo URL de solicitud autenticada previamente: introduzca la URL de solicitud autenticada previamente para acceder al cubo de almacenamiento de objetos. Para obtener más información sobre el uso de este tipo de conexión, consulte Uso de solicitudes autenticadas previamente.
    Región de OCI Introduzca el identificador de región de su recurso de Object Storage.

    Para ver el identificador de región de su región en la consola, en el menú Perfil, haga clic en Tenencia: <your_tenancy_name>. En el banner de información Gestión de regiones, haga clic en Gestión de regiones. Aparecerán los nombres y los identificadores de región.

    Compartimento Seleccione el compartimento para el recurso de Object Storage.

    Para ver el compartimento, en la consola, abra el menú de navegación y haga clic en Identidad y seguridad. En Identidad, haga clic en Compartimentos. Haga clic en el enlace del compartimento para el recurso de Object Storage. En la página Detalles del compartimento, copie el OCID en el separador Información del compartimento.

    Convertir esta conexión en el valor por defecto para el activo de datos. Seleccione esta casilla de control para convertir esta conexión en la conexión predeterminada para el activo de datos.
    Probar conexión Haga clic en el botón para probar la conexión.
  5. Haga clic en Agregar.

4. Recopilación del activo de datos

Ya está listo para recoger el activo de datos de Oracle Object Storage.

Para recoger el activo de datos de Oracle Object Storage, realice los siguientes pasos:

  1. En la página de detalles del activo de datos, haga clic en Recopilar.
    Aparece la página Seleccionar conexión con la conexión por defecto seleccionada.
  2. Haga clic en Siguiente.
    Aparece la página Seleccionar entidades de datos.
  3. En la sección Cubos disponibles, agregue las entidades de datos que desea recopilar. Para agregar una entidad de datos, haga clic en el icono de agregación situado junto a ella. Para recopilar todas las entidades de datos, haga clic en Agregar todo.
    Las otras operaciones que puede realizar en esta página son las siguientes:
    • Para buscar una entidad de datos en las entidades de datos disponibles, utilice el recuadro Filtrar Cubo/Entidades de datos.
    • Utilice los iconos de navegación de la página para examinar todas las entidades de datos.
    • Para eliminar una entidad de datos seleccionada del trabajo de recopilación, haga clic en el icono de eliminación situado junto a la entidad de datos.
    • Para eliminar todas las entidades de datos seleccionadas, haga clic en Suprimir Todo.
  4. Haga clic en Siguiente.
    Aparece la página Crear Trabajo.
  5. En esta página, haga lo siguiente:
    1. Nombre del trabajo: introduzca un nombre único para identificar el trabajo de recopilación.
    2. Descripción del trabajo: introduzca una descripción.
    3. Recogida incremental: seleccione esta casilla de control si desea que las ejecuciones posteriores de este trabajo de recopilación solo recojan las entidades de datos que hayan cambiado desde la primera ejecución del trabajo de recopilación.
    4. Incluir archivos no reconocidos: seleccione esta casilla de control para recopilar una entidad de datos lógica compuesta solo por archivos archivados o cualquier otro archivo que no esté soportado en Data Catalog. Por ejemplo, .log, .txt, .sh, .jar y .pdf.
    5. Incluir solo archivos coincidentes: seleccione esta casilla de control si desea que Data Catalog recopile solo los archivos que coincidan con los patrones de nombre de archivo asignados. Si selecciona esta casilla de control, los archivos que no coinciden con los patrones de nombre de archivo asignados se ignorarán durante la recopilación. Se agregarán al recuento de omitidos.
    6. Tiempo de ejecución: en esta sección, seleccione una de las opciones siguientes:
      • Ejecutar trabajo ahora: crea un trabajo de recogida y lo ejecuta de inmediato.
      • Planificar ejecución de trabajo: muestra más campos para programar el trabajo de recogida. Introduzca un nombre y una descripción para el programa. Especifique la frecuencia con la que desea que se ejecute el trabajo. Las opciones son por hora, diariamente, semanalmente y mensualmente. Por último, seleccione la hora de inicio y de finalización para el trabajo.
      • Guardar configuraciones de trabajo para después: crea un trabajo de recogida del activo de datos, pero el trabajo no se ejecuta. Puede ejecutar o programar el trabajo en la página Trabajos más tarde.
  6. Haga clic en Crear trabajo.
    El trabajo para recoger el activo de datos de Oracle Object Storage se ha creado correctamente. El trabajo se muestra en la página Trabajos.
El activo de datos se recopila correctamente en función del programa que haya seleccionado. Puede revisar los detalles del trabajo de recopilación haciendo clic en el nombre del trabajo en la página Trabajos.