Uso de un modelo entrenado previamente en la consola
Vision proporciona modelos preentrenados para extraer información de las imágenes, sin necesidad de científicos de datos.
En este tutorial aprenderá a:
- 1. Descripción de los requisitos de datos.
- 2. Carga de datos en Object Storage.
- Ejecute Document AI en un documento que haya cargado.
- Ejecute Análisis de imagen en una imagen que haya cargado.
Antes de empezar
Antes de utilizar Vision, el administrador del arrendamiento debe configurar las políticas adecuadas.
Configuración de políticas
Siga estos pasos para configurar las políticas necesarias para utilizar Vision.
1. Descripción de los requisitos de datos
Vision funciona con muchos formatos de datos de imagen para detectar objetos, asignar etiquetas a imágenes, extraer texto y mucho más. Acepta datos a través de Object Storage. Si Vision se ejecuta en la consola, también puede proporcionar imágenes almacenadas localmente.
API | Descripción | Formato de Entrada Soportado |
---|---|---|
API síncrona
|
Analiza imágenes individuales. |
|
API asíncrona | Analiza varias imágenes o PDF de varias páginas. |
|
2. Carga de datos en Object Storage
En este paso, cargue en Object Storage las imágenes y los documentos que desea analizar.
Complete 1. Comprenda los requisitos de datos antes de probar esta sección.
Cree un cubo de Object Storage
Si ya tiene un cubo en Object Storage que puede utilizar, vaya directamente a la siguiente sección sobre la carga de archivos de imagen.
- En el menú de navegación de la consola, seleccione Storage (Almacenamiento).
- En Object Storage, seleccione Buckets.
- En la página Cubos, en Ámbito de lista, seleccione el compartimento.
- Seleccione Crear cubo. Se muestra el panel Crear cubo.
- Introduzca un Nombre de depósito. No introduzca información confidencial.
- En Default Storage Tier, seleccione Standard. Deje todos los demás campos en sus valores por defecto.
- Haga clic en Crear.
Carga de archivos de imagen en el cubo de Object Storage
- En la página Cubos, seleccione el nombre del cubo en el que va a cargar imágenes. Se muestra la página de detalles del cubo.
- En Recursos, seleccione Objetos para visualizar la lista de objetos en el cubo.
- Seleccione Cargar. Se muestra el panel Cargar objetos.
- Arrastre los archivos que desea cargar al panel o seleccione seleccionar archivos para seleccionarlos de los archivos locales.
3. IA de documento
Pasos para utilizar las funciones de IA de documentos en Vision.
Complete 2. Cargue datos en Object Storage antes de intentar esta sección.
Abrir Consola de Visión
- En el menú de navegación de la consola, seleccione Análisis y AI.
- En Servicios AI, haga clic en Visión. Se muestra la página de inicio de Visión.
Usar IA de documento
- En Visión, seleccione Documento AI. Aparece la página Document AI.
- En Origen de imagen, seleccione Almacenamiento de objetos.
- Seleccione un documento que cargó en 2. Cargar datos en Object Storage. Se llama a la API analyzeDocument.
Función | Descripción | Resultados: |
---|---|---|
OCR (reconocimiento óptico de caracteres) | Busca y digitaliza información de texto a partir de las imágenes. | El texto identificado en el documento se muestra en Texto sin formato en el panel Resultados. |
Clasificación de imagen de documento | Clasifica los documentos en función de su apariencia visual, funciones de alto nivel y palabras clave extraídas. | La clasificación en un tipo de documento junto con una puntuación de confianza se muestra en el panel Resultados. |
Clasificación de idioma | Clasifica el idioma del documento en función de las características visuales. | La clasificación en un idioma de documento junto con una puntuación de confianza se muestra en el panel Resultados. |
Extracción de tabla | Extrae el contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas. | En el panel Resultados, haga clic en el separador Tabla para ver la salida. |
Salida de PDF apta para búsqueda | Embebe una capa transparente sobre la imagen del documento en formato PDF para que permita la búsqueda por palabras clave.
Nota: Esta funcionalidad solo está disponible cuando se proporciona un documento PDF. |
Haga clic en PDF apto para búsqueda. Se descarga un archivo PDF de OCR en el equipo. |
4. Análisis de imagen
Pasos para utilizar las funciones de análisis de imágenes en Visión.
Complete 2. Cargue datos en Object Storage antes de intentar esta sección.
Abrir Consola de Visión
- En el menú de navegación de la consola, seleccione Análisis y AI.
- En Servicios de IA, seleccione Visión. Se muestra la página inicial de Vision.
Usar clasificación de imagen
- En Visión, seleccione Clasificación de imagen. Se muestra la página Clasificación de imagen.
- Seleccione Almacenamiento de objetos.
- Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.
Los resultados que categorizan los objetos de la imagen se muestran en la sección Resultados. Hay etiquetas para clasificar los objetos detectados y una puntuación de confianza para cada objeto.
Utilizar detección de objetos
- En Visión, seleccione Detección de objetos. Aparece la página Object Detection.
- Seleccione Almacenamiento de objetos.
- Seleccione una imagen que haya cargado en 2. Cargar datos en Object Storage. Se llama a la API analyzeIamge.
Los resultados se muestran en la sección Resultados. Los objetos detectados, una puntuación de confianza para cada objeto y un cuadro delimitador resaltado alrededor de cada objeto se muestran en el panel Resultados. Si hace clic en una etiqueta, en la imagen se muestra el objeto detectado.
Siguiente paso
Ahora ya sabes cómo usar Vision con modelos preentrenados, intenta usarlo con modelos personalizados.