Uso de un modelo entrenado previamente en la consola

Vision proporciona modelos preentrenados para extraer información de las imágenes, sin necesidad de científicos de datos.

En este tutorial aprenderá a:

1. Descripción de los requisitos de datos.
2. Carga de datos en Object Storage.
Ejecute Document AI en un documento que haya cargado.
Ejecute Análisis de imagen en una imagen que haya cargado.

Antes de empezar

Antes de utilizar Vision, el administrador del arrendamiento debe configurar las políticas adecuadas.

Configuración de políticas

Siga estos pasos para configurar las políticas necesarias para utilizar Vision.

En el menú de navegación de la consola, seleccione Identidad y seguridad.
En Identidad, seleccione Políticas.
Seleccione Crear política.
Se muestra el panel Crear política.
Introducir un Nombre. Solo puede utilizar caracteres alfanuméricos, guiones, puntos y guiones bajos. No se permiten espacios. Por ejemplo, introduzca vision-access-policy.
Introduzca una descripción para ayudar a otros usuarios a conocer la finalidad de este juego de políticas. Por ejemplo, introduzca Policy to access Vision service..
Seleccione el compartimento.
En Creador de política, seleccione Mostrar editor manual.

Agregue la siguiente sentencia:

allow any-user to use ai-service-vision-family in tenancy

(Opcional) Para limitar el acceso solo a su grupo de usuarios, agregue la siguiente política en su lugar:
```
allow group <your-group-name> to use ai-service-vision-family in tenancy
```
Haga clic en Crear.

1. Descripción de los requisitos de datos

Vision funciona con muchos formatos de datos de imagen para detectar objetos, asignar etiquetas a imágenes, extraer texto y mucho más. Acepta datos a través de Object Storage. Si Vision se ejecuta en la consola, también puede proporcionar imágenes almacenadas localmente.

Vision ofrece API síncronas y asíncronas para analizar imágenes. Los requisitos de datos para cada uno se explican en la siguiente tabla:

Requisitos de los datos de API
API	Descripción	Formato de Entrada Soportado
API síncrona analyzeImage analyzeDocument	Analiza imágenes individuales.	JPG, PNG. PDF y TIFF también son compatibles con analyzeDocument Hasta 5 MB Entrada de imagen única
API asíncrona	Analiza varias imágenes o PDF de varias páginas.	JPG, PNG. PDF y TIFF también son compatibles con analyzeDocument Admite PDF de varias páginas Entrada de hasta 2.000 imágenes

2. Carga de datos en Object Storage

En este paso, cargue en Object Storage las imágenes y los documentos que desea analizar.

Complete 1. Comprenda los requisitos de datos antes de probar esta sección.

Cree un cubo de Object Storage

Si ya tiene un cubo en Object Storage que puede utilizar, vaya directamente a la siguiente sección sobre la carga de archivos de imagen.

En el menú de navegación de la consola, seleccione Storage (Almacenamiento).
En Object Storage, seleccione Buckets.
En la página Cubos, en Ámbito de lista, seleccione el compartimento.
Seleccione Crear cubo. Se muestra el panel Crear cubo.
Introduzca un Nombre de depósito. No introduzca información confidencial.
En Default Storage Tier, seleccione Standard. Deje todos los demás campos en sus valores por defecto.
Haga clic en Crear.

Carga de archivos de imagen en el cubo de Object Storage

En la página Cubos, seleccione el nombre del cubo en el que va a cargar imágenes. Se muestra la página de detalles del cubo.
En Recursos, seleccione Objetos para visualizar la lista de objetos en el cubo.
Seleccione Cargar. Se muestra el panel Cargar objetos.
Arrastre los archivos que desea cargar al panel o seleccione seleccionar archivos para seleccionarlos de los archivos locales.

3. IA de documento

Pasos para utilizar las funciones de IA de documentos en Vision.

Complete 2. Cargue datos en Object Storage antes de intentar esta sección.

Abrir Consola de Visión

En el menú de navegación de la consola, seleccione Análisis y AI.
En Servicios AI, haga clic en Visión. Se muestra la página de inicio de Visión.

Usar IA de documento

En Visión, seleccione Documento AI. Aparece la página Document AI.
En Origen de imagen, seleccione Almacenamiento de objetos.
Seleccione un documento que cargó en 2. Cargar datos en Object Storage. Se llama a la API analyzeDocument.

Estas funciones se llaman y sus resultados se muestran en la consola:

Resultados de IA de documento
Función	Descripción	Resultados:
OCR (reconocimiento óptico de caracteres)	Busca y digitaliza información de texto a partir de las imágenes.	El texto identificado en el documento se muestra en Texto sin formato en el panel Resultados.
Clasificación de imagen de documento	Clasifica los documentos en función de su apariencia visual, funciones de alto nivel y palabras clave extraídas.	La clasificación en un tipo de documento junto con una puntuación de confianza se muestra en el panel Resultados.
Clasificación de idioma	Clasifica el idioma del documento en función de las características visuales.	La clasificación en un idioma de documento junto con una puntuación de confianza se muestra en el panel Resultados.
Extracción de tabla	Extrae el contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas.	En el panel Resultados, haga clic en el separador Tabla para ver la salida.
Salida de PDF apta para búsqueda	Embebe una capa transparente sobre la imagen del documento en formato PDF para que permita la búsqueda por palabras clave. Nota: Esta funcionalidad solo está disponible cuando se proporciona un documento PDF.	Haga clic en PDF apto para búsqueda. Se descarga un archivo PDF de OCR en el equipo.

4. Análisis de imagen

Pasos para utilizar las funciones de análisis de imágenes en Visión.

Complete 2. Cargue datos en Object Storage antes de intentar esta sección.

Abrir Consola de Visión

En el menú de navegación de la consola, seleccione Análisis y AI.
En Servicios de IA, seleccione Visión. Se muestra la página inicial de Vision.

Usar clasificación de imagen

En Visión, seleccione Clasificación de imagen. Se muestra la página Clasificación de imagen.
Seleccione Almacenamiento de objetos.
Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.

Los resultados que categorizan los objetos de la imagen se muestran en la sección Resultados. Hay etiquetas para clasificar los objetos detectados y una puntuación de confianza para cada objeto.

Utilizar detección de objetos

En Visión, seleccione Detección de objetos. Aparece la página Object Detection.
Seleccione Almacenamiento de objetos.
Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.

Los resultados se muestran en la sección Resultados. Los objetos detectados, una puntuación de confianza para cada objeto y un cuadro delimitador resaltado alrededor de cada objeto se muestran en el panel Resultados. Si hace clic en una etiqueta, en la imagen se muestra el objeto detectado.

Siguiente paso

Ahora ya sabes cómo usar Vision con modelos preentrenados, intenta usarlo con modelos personalizados.

Documentación de Oracle Cloud Infrastructure

Uso de un modelo entrenado previamente en la consola

Antes de empezar

Configuración de políticas

1. Descripción de los requisitos de datos

2. Carga de datos en Object Storage

Cree un cubo de Object Storage

Carga de archivos de imagen en el cubo de Object Storage

3. IA de documento

Abrir Consola de Visión

Usar IA de documento

4. Análisis de imagen

Abrir Consola de Visión

Usar clasificación de imagen

Utilizar detección de objetos

Siguiente paso