Visión General del Servicio

Document Understanding es un servicio multi-inquilino sin servidor que puede utilizar para detectar y clasificar texto, tablas y otros datos clave de los archivos de documentos que carga.

Se puede acceder al servicio mediante la consola, las API de REST, el SDK y la CLI. Puede procesar archivos individuales o lotes de documentos mediante el punto final de API ProcessorJob.

Se admiten los siguientes modelos preentrenados:

Reconocimiento óptico de caracteres (OCR): detecta y reconoce texto en un documento.
Extracción de texto: proporciona el texto a nivel de palabra y línea, y las coordenadas del cuadro delimitador en el que se encuentra el texto.
Extracción de clave-valor: extrae una lista predefinida de información de par clave-valor de recibos, facturas, pasaportes e ID de controlador.
Extracción de tablas: extrae el contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas.
Clasificación de documentos: clasifica documentos en diferentes tipos en función de la apariencia visual, las funciones de alto nivel y las palabras clave extraídas. Algunos tipos de documento de ejemplo son factura, recibo y currículum.
PDF de reconocimiento óptico de caracteres (OCR): genera un archivo PDF con capacidad de búsqueda en el servicio OCI Object Storage.

Documentación de Oracle Cloud Infrastructure Probar cuenta gratuita

Visión General del Servicio

Documentación de Oracle Cloud Infrastructure
Probar cuenta gratuita