En los últimos años la digitalización de la información (textos, imágenes, sonido, etc ) ha ido cobrando interés para la sociedad. En el caso concreto de los textos, existen y se generan continuamente grandes cantidades de información escrita, tipográfica o manuscrita en todo tipo de soportes. En este contexto, poder automatizar la introducción de caracteres evitando la entrada por teclado, implica un importante ahorro de recursos humanos y un aumento de la productividad, al mismo tiempo que se mantiene, o hasta se mejora, la calidad de muchos servicio.

El Instituto para el Desarrollo Tecnológico y la Innovación en Comunicaciones (IDeTIC) ha diseñado y desarrollado un sistema de reconocimiento óptico de caracteres (OCR) tanto impresos como manuscritos

El objetivo es digitalizar documentos estructurados o semiestructurados catalogando automáticamente los documentos con los metadatos obtenidos y archivándolos en formato digital para facilitar su posterior búsqueda. Tiene el inconveniente de que es necesario diseñar previamente las plantillas, pero con una buena configuración se ahorra mucho tiempo en el proceso de digitalización.

Las ventajas que ofrece este sistema son una alta fiabilidad en el reconocimiento, así como flexibilidad adaptándose a las necesidades del usuario.

Más concretamente, este sistema podría:

  • Reconocer cheques bancarios.
  • Recocer matrículas de coche. Es un sistema con una alta fiabilidad como demuestran las altas tasas de acierto conseguidas. Útil en control y seguridad en parking, búsqueda de vehículos robados, etc…
  • Reconocer texto en impresos administrativos manuscritos e impresos. Con el objetivo de automatizar procesos, y en el caso de manuscritos, disponer de forma digitalizada los documentos (por ejemplo facturas para automatizar la contabilidad)

Investigador responsable: Miguel A. Ferrer.