Método y sistema para generar texto manuscrito con diferentes grados de madurez del escritor



Tipo de resultado de I+D

Tecnología

Grado de madurez comercial

Validado en entorno controlado

Grado de protección

Patente



Se trata de un sistema que permite generar textos sintéticos similar al de escritores reales con diferentes grados de aprendizaje o capacidades neurológicas y motoras. De esta forma, permite la simulación de procesos de evolución temporal del aprendizaje del escritor.
El sistema, que puede implementarse en software, en hardware o en una combinación de ambos, no requiere de un texto original para sintetizar otro que simula a escritores reales con diferentes grados de aprendizaje o capacidades neurológicas y motoras. El sistema está protegido mediante las patentes ES201600539 y US10,977,422.

Si bien existen algunos métodos que tratan de solucionar el problema técnico de generar texto manuscrito sintético, en general plantean las siguientes dificultades:

  • Se basan en procesar la imagen del texto manuscrito, con lo que aumenta el tiempo de procesado.
  • No simulan el aprendizaje y la variabilidad que se obtiene con la práctica, ni dan las posiciones del lápiz con su referencia temporal.

Los desafíos técnicos que resuelve el método seguido consisten en sintetizar texto similar al real simulando su evolución tanto en número de trazos, como en el perfil de velocidad del escritor según su progreso y dando la posibilidad de variar parámetros que pueden ser relacionados con patrones neurológicos o motores del aprendizaje humano de manera simple.
El procedimiento se realiza en diversas etapas:

  • Etapa 1: consiste en seleccionar la trayectoria de cada letra partiendo de una trayectoria previamente almacenada. Este proceso se realiza una única vez cuando se programa el tipo de escritura u idioma que se va a aprender.
  • Etapa 2: consiste en aplicar el método de evolución que selecciona una serie de puntos dependiendo de la edad del escritor.
  • Etapa 3: consiste en unir las distintas letras bajo la premisa de que las líneas superiores e inferiores de la cuadrícula (grid) queden unidas.

Cada dos puntos consecutivos del grid se considera un vector. El sistema calcula el ángulo entre dos vectores consecutivos, empleando una serie de parámetros que modelan el perfil de velocidad.

Adicionalmente, se utiliza una constante asociada a cada escritor que depende de sus características motoras y, por tanto, es diferente para cada individuo. Con el efecto del paso del tiempo, esta constante puede evolucionar.

Para sintetizar problemas en el aprendizaje o en la salud neurológica del individuo, se modifican distintos parámetros, pudiendo ajustarse según el tipo de enfermedad (Parkinson, esclerosis lateral amiotrófica, Alzheimer, etc.).

Los métodos existentes en la actualidad no solucionan el problema de generar texto manuscrito con diferentes grados de madurez del escritor, que simule su evolución y que permita, mediante el mínimo número de parámetros, simular tanto las posiciones del instrumento de escritura (bolígrafo o lápiz) en el tiempo, como el modo de escribir dependiendo de la edad o el tiempo de aprendizaje del escritor.
En comparación con otras soluciones alternativas, este sistema permite:

  • El reconocimiento óptico de caracteres (OCR) de texto manuscrito, mejorando su capacidad para la digitalización de dichos textos.
  • La adición de nuevas capas de seguridad en la generación de CAPTCHAS, aumentando la complejidad de lectura para robots con el fin de diferenciar usuarios humanos de ordenadores autómatas.
  • Mejorar la identificación del escritor.
  • Hacer un seguimiento del aprendizaje de la escritura de niños.
  • Mejorar la monitorización y el screening de enfermedades neurodegenerativas.
  • Mejorar la detección de trastornos en la capacidad o en la facultad de escribir (disgrafía).

El ámbito de aplicación natural de este sistema sintetizador de textos se circunscribe a la generación de bases de datos ilimitadas para el entrenamiento biométrico, es decir, para la identificación de personas en base al reconocimiento de una característica física e intransferible: la escritura.

Sin embargo, más allá de este propósito original, el sistema podría tener aplicaciones en áreas tan diversas como: la pedagogía, la educación, el reconocimiento óptico de caracteres (OCR – Optical Character Recognition), la seguridad software mediante CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart), la digitalización de textos, la neurología, o el diagnóstico de enfermedades neurodegenerativas.

La investigación sobre la síntesis de manuscritos se utiliza en diferentes campos. Una primera motivación era proporcionar una gran base de datos de escritura biométrica para evaluar los verificadores de firmas automáticos, o los identificadores automáticos del escritor, y evitar problemas legales sobre la privacidad.

La inclusión (en un sintetizador de manuscrito) de la variabilidad intra e ínter persona y la variabilidad de la salud debida a diferentes enfermedades, como el Parkinson o el Alzheimer, podrían ayudar a mejorar la comprensión de los procesos subyacentes en la producción de manuscritos humanos.
Estos sistemas podrían también ser de utilidad en las creaciones artísticas, para la identificación de su autoría, o para la generación de captchas de seguridad.

El sistema se ha validado comparando texto sintetizado con datos reales de niños y adultos. Solo en el ámbito de la educación y, en concreto, en el pedagógico, ya existen desarrollos para la inclusión de este sistema en plataformas comerciales para la enseñanza (GetWriting®).

María Cristina Carmona Duarte, Miguel Ángel Ferrer Ballester