¿Qué es un OCR y por qué IPA es mejor?

Una de las cuestiones que aparecen recurrentemente en muchos de los clientes a los cuales vamos a visitar es la siguiente: “nosotros ya tenemos un OCR, no sabemos exactamente qué valor adicional podéis dar a nuestros procesos.”

Actualmente el grado de desarrollo de la automatización inteligente de procesos todavía no ha calado lo suficientemente fuerte dentro de las empresas. Esto es debido a que es una tecnología que ha aparecido en los últimos años, aunque su crecimiento está siendo increíblemente grande. Cuando nos encontramos con empresas que ya vienen trabajando desde hace años con una tecnología antigua, como es el caso de los OCR, qué se pusieron a disposición de las empresas de forma extensiva a lo largo de las dos pasadas décadas, nos es muy sencillo demostrar todo el valor añadido que la Inteligencia Artificial es capaz de añadir al procesamiento de documentos. Ahora veremos el porqué.

Para señalar las principales diferencias entre ambas tecnologías primero de todo tenemos que definir lo que es. Un OCR o sistema óptico de caracteres es una tecnología que sobre un formato de imagen es capaz de extraer letras o símbolos que previamente le hayamos indicado las coordenadas en las que tienen que buscarlo. Así pues es una tecnología en la cual tenemos que indicar exactamente qué es lo que tiene que buscar y dónde lo tiene que buscar. Se trata de una tecnología perfectamente válida para todos aquellos eventos que se produzcan de igual manera. Uno de los casos de uso más habituales es el reconocimiento de matrículas de vehículos a la entrada de un parking: La Cámara fija siempre toma la misma fotografía y el OCR sabe dónde tiene que ir a buscar la matrícula. Este mismo caso llevado a los procesos corporativos podría darse en aquellos documentos que siempre son de la misma forma y un mismo formato. 

Sin embargo si lo estamos enfrentando a situaciones a menudo cambiantes tendremos que tener distintas plantillas para poder extraer esa información. A menudo es un tema laborioso y si no se cumple con un determinado formato acaban por fracasar y finalmente la tendencia es que el ser humano arregle por fuera del sistema lo que no ha podido reconocer el OCR.

¿Por qué los cerebros digitales son la mejor alternativa a un OCR?

En contraposición al OCR, el cerebro digital no solamente realiza una lectura total del documento con independencia del formato, sino que además aplican determinadas reglas aprendidas sobre la validación del mismo y el significado de los datos que extraen. Uno de los ejemplos más representativos de esta ventaja se produce cuanto tenemos que procesar facturar que, aun siendo de un mismo proveedor, poseen distinta longitud en cuanto al número de páginas, por lo tanto, no coincide la información a capturar un unas coordenadas determinadas siempre. Un OCR no es capaz de conocer y extraer la información que necesita, sin embargo un cerebro digital después de leer todo el contenido es capaz de pensar cuáles son los datos requeridos y extraerlos en consecuencia. 

Otro aspecto adicional que se puede tener con los cerebros digitales es la validación de la información incorporada. Es habitual que en algunos casos la factura se haya impreso de forma deficiente o manchada y alguno de los caracteres no sean captados correctamente por el OCR, como puede ser la falta de una coma a la hora de hacer un IVA. Por ejemplo si el importe neto son 100 euros, y el IVA al faltarle la coma aparece como 2.100 euros  y el total de la factura con impuestos es 121 €, el OCR trasladará al ERP de la empresa ese error de 2.100 € en el IVA. 

En contraposición, un cerebro digital habrá hecho el cálculo de la factura expresando que si el total sin impuestos es de €100 y el impuesto aplicable es del 21% es totalmente imposible que el total de impuestos sea €2100, por lo que saltará una alerta para que un usuario humano revise ese error.

Igualmente estas comprobaciones son aplicables no solo a errores, sino a intentos de fraude y otros ataques a través de documentos.

Como punto final y resumen, queremos destacar que si bien el OCR a día de hoy sigue siendo una tecnología válida para algunos casos de uso, la aplicación de inteligencia artificial al reconocimiento de la información obtenida en documentos es la que verdaderamente reduce todos los tiempos de forma eficiente y automatizada de cara a conseguir una mejora en la productividad.

Acerca de Dost

Dost es una empresa de Automatización Inteligente de Procesos como Servicio que aprovecha la inteligencia artificial, el aprendizaje automático y las tecnologías de automatización para ofrecer a sus clientes Digital Coworkers impulsados por Dost Digital Brain como servicio.

Podéis manteneros informados de toda nuestra actividad en redes sociales –TwitterLinkedInInstagram y Facebook.

Si tienes cualquier duda, contacta con nosotros