Uso de un modelo entrenado previamente en la consola

Vision proporciona modelos preentrenados para extraer información de las imágenes, sin necesidad de científicos de datos.

En este tutorial aprenderá a:

Antes de empezar

Antes de utilizar Vision, el administrador del arrendamiento debe configurar las políticas adecuadas.

Configuración de políticas

Siga estos pasos para configurar las políticas necesarias para utilizar Vision.

  1. En el menú de navegación de la consola, seleccione Identidad y seguridad.
  2. En Identidad, seleccione Políticas.
  3. Seleccione Crear política.
    Se muestra el panel Crear política.
  4. Introducir un Nombre. Solo puede utilizar caracteres alfanuméricos, guiones, puntos y guiones bajos. No se permiten espacios. Por ejemplo, introduzca vision-access-policy.
  5. Introduzca una descripción para ayudar a otros usuarios a conocer la finalidad de este juego de políticas. Por ejemplo, introduzca Policy to access Vision service..
  6. Seleccione el compartimento.
  7. En Creador de política, seleccione Mostrar editor manual.
  8. Agregue la siguiente sentencia:
    allow any-user to use ai-service-vision-family in tenancy
  9. (Opcional) Para limitar el acceso solo a su grupo de usuarios, agregue la siguiente política en su lugar:
    allow group <your-group-name> to use ai-service-vision-family in tenancy
  10. Haga clic en Crear.

1. Descripción de los requisitos de datos

Vision funciona con muchos formatos de datos de imagen para detectar objetos, asignar etiquetas a imágenes, extraer texto y mucho más. Acepta datos a través de Object Storage. Si Vision se ejecuta en la consola, también puede proporcionar imágenes almacenadas localmente.

Vision ofrece API síncronas y asíncronas para analizar imágenes. Los requisitos de datos para cada uno se explican en la siguiente tabla:
Requisitos de los datos de API
API Descripción Formato de Entrada Soportado
API síncrona
  • analyzeImage
  • analyzeDocument
Analiza imágenes individuales.
  • JPG, PNG. PDF y TIFF también son compatibles con analyzeDocument
  • Hasta 5 MB
  • Entrada de imagen única
API asíncrona Analiza varias imágenes o PDF de varias páginas.
  • JPG, PNG. PDF y TIFF también son compatibles con analyzeDocument
  • Admite PDF de varias páginas
  • Entrada de hasta 2.000 imágenes

2. Carga de datos en Object Storage

En este paso, cargue en Object Storage las imágenes y los documentos que desea analizar.

Complete 1. Comprenda los requisitos de datos antes de probar esta sección.

Cree un cubo de Object Storage

Si ya tiene un cubo en Object Storage que puede utilizar, vaya directamente a la siguiente sección sobre la carga de archivos de imagen.

  1. En el menú de navegación de la consola, seleccione Storage (Almacenamiento).
  2. En Object Storage, seleccione Buckets.
  3. En la página Cubos, en Ámbito de lista, seleccione el compartimento.
  4. Seleccione Crear cubo. Se muestra el panel Crear cubo.
  5. Introduzca un Nombre de depósito. No introduzca información confidencial.
  6. En Default Storage Tier, seleccione Standard. Deje todos los demás campos en sus valores por defecto.
  7. Haga clic en Crear.

Carga de archivos de imagen en el cubo de Object Storage

  1. En la página Cubos, seleccione el nombre del cubo en el que va a cargar imágenes. Se muestra la página de detalles del cubo.
  2. En Recursos, seleccione Objetos para visualizar la lista de objetos en el cubo.
  3. Seleccione Cargar. Se muestra el panel Cargar objetos.
  4. Arrastre los archivos que desea cargar al panel o seleccione seleccionar archivos para seleccionarlos de los archivos locales.

3. IA de documento

Pasos para utilizar las funciones de IA de documentos en Vision.

Complete 2. Cargue datos en Object Storage antes de intentar esta sección.

Abrir Consola de Visión

  1. En el menú de navegación de la consola, seleccione Análisis y AI.
  2. En Servicios AI, haga clic en Visión. Se muestra la página de inicio de Visión.

Usar IA de documento

  1. En Visión, seleccione Documento AI. Aparece la página Document AI.
  2. En Origen de imagen, seleccione Almacenamiento de objetos.
  3. Seleccione un documento que cargó en 2. Cargar datos en Object Storage. Se llama a la API analyzeDocument.
Estas funciones se llaman y sus resultados se muestran en la consola:
Resultados de IA de documento
Función Descripción Resultados:
OCR (reconocimiento óptico de caracteres) Busca y digitaliza información de texto a partir de las imágenes. El texto identificado en el documento se muestra en Texto sin formato en el panel Resultados.
Clasificación de imagen de documento Clasifica los documentos en función de su apariencia visual, funciones de alto nivel y palabras clave extraídas. La clasificación en un tipo de documento junto con una puntuación de confianza se muestra en el panel Resultados.
Clasificación de idioma Clasifica el idioma del documento en función de las características visuales. La clasificación en un idioma de documento junto con una puntuación de confianza se muestra en el panel Resultados.
Extracción de tabla Extrae el contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas. En el panel Resultados, haga clic en el separador Tabla para ver la salida.
Salida de PDF apta para búsqueda Embebe una capa transparente sobre la imagen del documento en formato PDF para que permita la búsqueda por palabras clave.

Nota: Esta funcionalidad solo está disponible cuando se proporciona un documento PDF.

Haga clic en PDF apto para búsqueda. Se descarga un archivo PDF de OCR en el equipo.

4. Análisis de imagen

Pasos para utilizar las funciones de análisis de imágenes en Visión.

Complete 2. Cargue datos en Object Storage antes de intentar esta sección.

Abrir Consola de Visión

  1. En el menú de navegación de la consola, seleccione Análisis y AI.
  2. En Servicios de IA, seleccione Visión. Se muestra la página inicial de Vision.

Usar clasificación de imagen

  1. En Visión, seleccione Clasificación de imagen. Se muestra la página Clasificación de imagen.
  2. Seleccione Almacenamiento de objetos.
  3. Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.

Los resultados que categorizan los objetos de la imagen se muestran en la sección Resultados. Hay etiquetas para clasificar los objetos detectados y una puntuación de confianza para cada objeto.

Utilizar detección de objetos

  1. En Visión, seleccione Detección de objetos. Aparece la página Object Detection.
  2. Seleccione Almacenamiento de objetos.
  3. Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.

Los resultados se muestran en la sección Resultados. Los objetos detectados, una puntuación de confianza para cada objeto y un cuadro delimitador resaltado alrededor de cada objeto se muestran en el panel Resultados. Si hace clic en una etiqueta, en la imagen se muestra el objeto detectado.

Siguiente paso

Ahora ya sabes cómo usar Vision con modelos preentrenados, intenta usarlo con modelos personalizados.