Esta página ha sido traducida por una máquina.

Visión General del Servicio

Document Understanding es un servicio multi-inquilino sin servidor que puede utilizar para detectar y clasificar texto, tablas y otros datos clave de los archivos de documentos que carga.

Se puede acceder al servicio mediante la consola, las API de REST, el SDK y la CLI. Puede procesar archivos individuales o lotes de documentos mediante el punto final de API ProcessorJob.

Se admiten los siguientes modelos preentrenados:

  • Reconocimiento óptico de caracteres (OCR): detecta y reconoce texto en un documento.
  • Extracción de texto: proporciona el texto a nivel de palabra y línea, y las coordenadas del cuadro delimitador en el que se encuentra el texto.
  • Extracción de clave-valor: extrae una lista predefinida de información de par clave-valor de recibos, facturas, pasaportes e ID de controlador.
  • Extracción de tablas: extrae el contenido en formato tabular, manteniendo las relaciones de fila y columna de las celdas.
  • Clasificación de documentos: clasifica documentos en diferentes tipos en función de la apariencia visual, las funciones de alto nivel y las palabras clave extraídas. Algunos tipos de documento de ejemplo son factura, recibo y currículum.
  • PDF de reconocimiento óptico de caracteres (OCR): genera un archivo PDF con capacidad de búsqueda en el servicio OCI Object Storage.

¿Le ha resultado útil este artículo?