
Bajo el liderazgo de Zhiyi Yu, una selecta agrupación de investigadores de la Universidad Sun Yat-sen han creado un novedoso y mejorado algoritmo para el reconocimiento de gestos manuales que destaca por su complejidad, precisión y aplicabilidad.
El uso de gestos manuales en las interacciones humano-computadora está en constante crecimiento. Avances significativos en sistemas de cámaras, análisis de imágenes y machine learning han propiciado importantes mejoras en el reconocimiento óptico de gestos. Sin embargo, los métodos contemporáneos enfrentan obstáculos debido a su alta complejidad computacional, velocidad reducida, precisión limitada y gestos reconocibles escasos.[automatic_youtube_gallery type="search" search="Los científicos crean un nuevo algoritmo para el reconocimiento de gestos manuales" cache="2419200" per_page="1" thumb_excerpt="0" player_description="0"]
El innovador algoritmo de reconocimiento de gestos
El recién diseñado algoritmo por el equipo de investigación afronta estos contratiempos, detallado en un artículo publicado en la Revista de imágenes electrónicas.
Una de las metas primordiales del equipo fue la creación de un algoritmo que no solo superase dichos desafíos, sino que además pudiese ser implementado con facilidad en dispositivos de consumo masivo.
Capacidad de adaptación a diversos tipos de manos
El algoritmo resalta por su capacidad para adaptarse a diferentes tipos de manos. Primero, determina si la mano del usuario es delgada, normal o ancha, basándose en tres medidas que consideran las relaciones entre el ancho y largo de la palma, así como la longitud de los dedos.
Una vez realizada la clasificación, el proceso de reconocimiento de gestos compara la entrada con ejemplos almacenados del mismo tipo de mano.
“Los algoritmos convencionales tienden a sufrir bajos índices de reconocimiento debido a su incapacidad para manejar diferentes tipos de manos. Al dividir primero la entrada por tipo de mano y posteriormente utilizar una biblioteca de ejemplos que coincidan con este tipo, podemos aumentar considerablemente la tasa de reconocimiento sin consumir un número significativo de recursos”, afirma el líder del equipo, Yu.
La fase previa al reconocimiento
El procedimiento del equipo también implementa un «atajo funcional» para un paso previo al reconocimiento. El algoritmo es capaz de identificar un gesto entre nueve posibles; sin embargo, comparar todas las características del gesto de entrada con los ejemplos almacenados para todos los gestos puede tomar mucho tiempo.
Para resolver este problema, la etapa previa al reconocimiento en el algoritmo calcula la proporción del área de la mano para seleccionar los tres gestos más probables entre los nueve posibles. Este proceso asciende a tres el número de candidatos, mientras que el gesto final es decidido mediante la extracción de características de alta precisión y complejidad, basada en los «momentos invariantes de Hu».
«El paso previo de reconocimiento no solo reduce los cálculos y recursos de hardware requeridos, además aumenta la velocidad del reconocimiento sin sacrificar la precisión», señala Yu.
Pruebas y resultados
El algoritmo se sometió a pruebas en un procesador de PC comercial y una plataforma FPGA utilizando una cámara USB. El equipo reunió a 40 voluntarios para realizar los nueve gestos manuales varias veces, utilizando a 40 más para determinar la precisión del sistema.
El sistema demostró que podía reconocer gestos manuales en tiempo real con una precisión superior al 93%. Esto se mantuvo incluso cuando las imágenes de los gestos de entrada eran rotadas, trasladadas o escaladas.
A futuro, los investigadores buscarán concentrarse en incrementar el rendimiento del algoritmo bajo diferentes condiciones de iluminación, así como ampliar la cantidad de gestos posibles.
