01. 06. 2021

RPA y Document Understanding : Procesado inteligente de documentos

Un post de
Arancha Fernández Argüelles

RPA (Robotic Process Automation) es la tecnología capaz de simular el trabajo humano en un ordenador con la que podemos automatizar las tareas más rutinarias y repetitivas. Pero RPA no sólo permite automatizar las tareas más mecánicas de una empresa, también ayuda con trabajos mucho más complicados que el clásico copy ✂️ paste 📋. Con Document Understanding un robot puede distinguir entre diferentes tipos de documentos, clasificarlos, leer su contenido y extraer de ellos la información deseada. ¿Qué es Document Understanding y cómo leer documentos con RPA? Te lo contamos.

RPA y Document Understanding : Procesado inteligente de documentos - Clarcat

¿Qué es Document Understanding?

Como su nombre indica, Document Understanding es una tecnología destinada a la comprensión inteligente de documentos. Se trata de una potente herramienta que nos facilita la vida permitiéndonos automatizar con RPA la lectura inteligente de todo tipo de documentos, aunque se encuentren en formato imagen como aquellos que hayan sido escaneados o fotografiados, e incluso los que contienen texto manuscrito.

Algo aparentemente sencillo pero que supone un cambio revolucionario en nuestra manera de trabajar: automatizar la lectura de información desde documentos cuyo formato está concebido para ser utilizados por humanos pero no por máquinas lo que supondrá evitar la entrada manual de datos. Esto se traduce en un importante ahorro de tiempo, un incremento en la productividad y la oportunidad de destinar el trabajo humano a labores que aporten un mayor valor a nuestros servicios.

¿Cómo leer documentos con RPA?

La clave para automatizar el trabajo de manipulación de documentos pasa por digitalizarlos convenientemente. Digitalizar un documento consiste en identificar el texto contenido en él. A priori puede parecer una tarea muy sencilla, y lo es cuando hablamos de documentos en formato PDF por ejemplo, pero cuando tratamos con imágenes la cosa se complica. ¿Cómo consigue un robot ‘leer’ una imagen?

Un archivo en formato imagen no consiste en un conjunto de caracteres como sucede con un PDF o un documento de texto, sino que se compone de una secuencia ordenada de píxeles de distintos colores. Para reconocer caracteres dentro de una amalgama de píxeles los robots software hacen uso de una tecnología denominada OCR: Optical Character Recognition, o reconocimiento óptico de caracteres.

Gracias a los modelos de Machine Learning e Inteligencia Artificial, se puede predecir cuándo un conjunto de píxeles en una imagen está representando una determinada letra, un determinado número, un signo de puntuación, … Esto permite reconocer en una imagen, como una simple foto de un ticket o un DNI escaneado, los símbolos y caracteres que haya en ella y traducirlos a un formato texto con el que ya sí podremos trabajar con normalidad.

Ni siquiera los textos manuscritos ✍ se resistirán, RPA permite implementar los algoritmos más avanzados capaces de ayudarnos incluso con la lectura de textos escritos a mano en formularios o recetas por ejemplo.

¿Cómo implementar Document Understanding?

RPA y Document Understanding : Procesado inteligente de documentos - Clarcat

El procesado inteligente de documentos sigue generalmente los siguientes pasos:

  • Extraer el texto contenido en el documento: para comenzar la comprensión de un documento es imprescindible conocer su contenido textual.
  • Reconocer el tipo de documento de que se trata y clasificarlo: en base al contenido de un documento un robot podrá reconocer ante qué tipo de documento se encuentra.
  • Extraer los datos necesarios según el tipo de documento: conocido el tipo de documento, un bot puede extraer de su contenido la información concreta que necesita de manera selectiva.

Recibir supervisión humana de los resultados y aprender de los fallos: los resultados de la clasificación del documento y la extracción de datos se pueden someter a validación humana, utilizando las correcciones para entrenar a los robots y mejorar su rendimiento.

Document Understanding es sólo el comienzo, RPA puede automatizar todas las operaciones asociadas a los datos obtenidos de cualquier documento: realizar altas y bajas de clientes, empleados o proveedores, gestionar la facturación, solicitar cambios de titularidad de propiedades. ¡Lo que necesites! Con RPA y Document Understanding la guinda la pones tú 🍒😉

 

Arancha Fernández Argüelles

Arancha Fernández Argüelles
RPA Developer en Clarcat

    ¿Conectamos?

    Envíanos un mensaje consultándonos tus dudas y trataremos de resolverlas en el menor tiempo posible