support@athento.com
icon-phone + 34 932 20 23 14
icon-search Introduce una palabra
icon-login Login

OCR

Accede a la información de documentos escaneados de forma rápida y sencilla


¿Qué es un software OCR?

Son aplicaciones dirigidas a la digitalización de textos en imágenes. Identifican automáticamente símbolos o caracteres que pertenecen a un determinado alfabeto, a partir de una imagen para almacenarla en forma de datos con los que podremos interactuar (editar, seleccionar, copiar y pegar) mediante un programa de edición de texto como Open Office o Microsoft Office Word, por ejemplo.

esquema_ocr

Así, si tenemos en el ordenador un documento escaneado en formato imagen (JPG, PNG, TIFF, etc.), por ejemplo un DNI, una nómina o una factura, no podremos procesar esta información realizando una búsqueda, seleccionando texto del contenido o transformándolo a otro formato (DOC y Excel de Microsoft Office, .ODT u .ODS de Open Office o TXT), a no ser que contemos con unSoftware de Reconocimiento Óptico de Caracteres (OCR).

El módulo de OCR puede integrarse en una solución software de gestión documental, tales como Nuxeo, Sharepoint, EMC Documentum, IBM FileNet o Alfresco. Así mismo, el sistema ECM Athento incorpora esta funcionalidad de serie.

 

¿Qué ventajas aporta un software OCR?

La principal ventaja es la capacidad de buscar contenido dentro de un documento escaneado sin OCR. Esto supone realizar búsquedas rápidas sin tener que perder tiempo buscando entre todo el documento, página a página, palabra a palabra, para encontrar algo concreto.

Además, este tipo de soluciones en organizaciones que ya tienen hardware de escaneo (equipos multifinción o escáneres) supone que no hay que reemplazar estos equipos por escáneres más modernos, en muchos casos con la misma calidad de escaneo, y con la única aportación del software OCR en el dispositivo.

Al centralizar, dentro de un Sistema de Gestión Documental el Software OCR, podemos realizar búsquedas directamente sobre los ficheros en formato imagen (por ejemplo un JPG) que contienen texto, y sólo se utiliza este software en una única ubicación, el servidor que alberga el Software de Gestión Documental.

 

¿Cuánto puedo ahorrar implantando un OCR?

En organizaciones que poseen grandes cantidades de escáneres sin software OCR, permite reutilizar estos componentes y no tener que afrontar la compra de una nueva flota de escáneres con OCR, con el consiguiente ahorro de dinero y de impacto en el medio ambiente (consumo de hardware y su transporte). En algunos casos, se puede tratar de miles de dispositivos, con lo que el ahorro puede estar en los centenares de miles de euros.

En términos de productividad, también existen organizaciones (incluso Bancos, como hemos podido constatar en nuestra experiencia) que poseen contratos y expedientes digitalizados en formato .TIFF o en formato PDF sin indexar. Para comprobar si un documento o un contrato concreto es el que estamos buscando, debemos abrirlo y leerlo, sin poder hacer una búsqueda “full text” sobre todo el contenido.

 

OCR vs documentos escaneados sin OCR o papel

Seguir trabajando con documentos en formato imagen de los que no podemos extraer información de forma automática, como seleccionar y copiar texto o realizar búsquedas, supone una pérdida importante en la productividad que se verá incrementada conforme los volúmenes de información sean cada vez mayores. Por supuesto, la información crece alrededor de un 20% cada año, por lo que estos ficheros son cada vez más frecuentes e intratables.

La tecnología de OCR resuelve estos problemas con un nivel tecnológico muy alto, que permite realizar reconocimiento de texto sobre documentos escaneados con una calidad bastante baja en comparación con otros sistemas OCR.

Por supuesto, frente a trabajar con papel, la ventajas son aún mayores: ahorro de espacio, ahorro de un componente altamente contaminante como el papel, gestión eficaz de la información etc.

Además, este módulo es perfecto para ser complementado con módulos de Firma DigitalGestión Documental Inteligente oFlujos de Trabajo-Workflows (BPM).

 

CMMI_Yerbabuena

Athento está
certificado en CMMI

ENISA

Financiado
por ENISA

ISO 27001

Data centers certificados
con la ISO 27001

Cloud Security Alliance

Athento está
certificado en CSA

Logo PCI DSS

PCI DSS Nivel
1 certificado

Logo SOC

SOC 1 tipo II and
SOC 2 tipo II certificado