
Un moderno proyecto de investigación ha generado un sistema económico capaz de reconocer a un individuo considerando el sonido de sus pisadas, con tan solo requerir un paso.
En el estudio Apartado pasivo de múltiples individuos a través de la diferenciación profunda y reconocimiento de las pisadas (PURE, por sus siglas en inglés), donde investigadores de la Universidad Tecnológica de Nanyang y la Universidad de Kentucky colaboraron, se lograron tasas de reconocimiento de hasta un 90%, utilizando muestras de audio especialmente cortas.
Cinco perfiles distintos de pasos capturados con el sistema PURE.
Aspectos técnicos del proyecto PURE: Inteligencia Artificial y Procesamiento de Audio
PURE ha construido su arquitectura basándose en datos obtenidos de diversos micrófonos básicos, y el audio capturado sin procesar se elimina del ruido ambiental gracias a una técnica conocida como resta espectral. Al presenciar una alta relación señal-ruido, por ejemplo, la conversación que sucede al momento de la captura, se activa un algoritmo de separación de fuentes para la extracción discreta de los pasos.
El audio de las pisadas es limpiado y analizado a través de la adaptación adversarial de dominio y la estructura comprende un extractor de características, un analizador de identidad y un discriminador de dominio.
Componentes físicos utilizados en el sistema PURE
El equipo empleado para el proyecto PURE se compone de un conjunto de micrófonos incorporados en un sistema personalizado basado en la tecnología Raspberry Pi 4.
Los micrófonos capturan audio a la mayor velocidad posible para las señales «transmitidas por la estructura» (pie en contacto con el suelo), dado que estos datos son de una duración extremadamente corta y necesitan ser lo más detallados posibles. No obstante, los pasos en el aire (el sonido de los pies realizando el paso hacia el siguiente contacto con el suelo) se reducen a 16 kHz para ahorrar en capacidad de procesamiento local para los pasos en la estructura.
Los investigadores generaron un conjunto de datos de entrenamiento a partir de las Caja de resonancia de efectos de sonido de pasosy los Efectos de sonido de pasos de Epidemic Sound. También utilizaron el componente de audio de varias charlas TED para generar datos de entrenamiento para el proceso de extracción de pasos de la conversación en segundo plano.
Evitar ‘ataques de repetición’ en el reconocimiento de pasos
Un sistema de esta naturaleza debe ser capaz de resistir los «ataques de repetición», donde un atacante podría grabar un patrón específico de pasos para reproducirlo con la intención de que el sistema identifique la grabación como un usuario real.
La ausencia de dinamismo en los pasos repetidos hace fácil revelarlos, pero es necesario tenerlo en cuenta al procesar los datos. Mediante la observación de la natural irregularidad de los pasos, y también su velocidad en el contexto del entorno (puesto que es improbable correr u pasear, por ejemplo, en un entorno de oficina), es posible garantizar que los datos que se reciben sean auténticos.
El proyecto hace uso de la técnica de conformación de haces para calcular el ToA, pero la extracción del AoA es más compleja y requiere una red neuronal tipo R-Net que, de nuevo, hace uso de aprendizaje adversarial para calcular el rango de una pisada. Este es esencialmente el mismo modelo que la red neuronal anterior, a excepción de que el analizador de identidad se sustituye por un estimador de rango.
Precisión del sistema
PURE fue puesto a prueba en una amplia variedad de entornos acústicos y usando diferentes velocidades de caminata a lo largo de una serie de distancias. Es obvio que a medida que aumenta el número de personas que generan pasos, la precisión naturalmente disminuya, lo mismo sucede cuando incrementa la rapidez de múltiples fuentes de pasos.
Cabe destacar que, en función de la adaptación del dominio, los resultados de más de 100 pruebas revelaron que el sistema podía identificar a un usuario con una precisión del 90,73% al 96,53% en un intervalo de 3 a 5 pasos; del 88,16% al 95,92% si se involucraban de 2 a 3 pasos; e incluso con un solo paso, se lograba un rango de precisión del 81,75% al 88,6%.
Los investigadores auguran una amplia aplicación para PURE, debido al bajo costo del hardware involucrado y a que también supera a sistemas similares en términos de latencia y precisión – todo esto mientras se mantiene resistente a la interferencia ambiental y los ataques de repetición.
El análisis de la biomecánica de la marcha y su auge en la Inteligencia Artificial
Esta esfera específica de la investigación del aprendizaje automático ha estado centrada principalmente en la visión por computadora durante el último decenio y recibió un impulso cultural cuando fue empleada como recurso argumental en la película Misión Imposible: Nación Secreta (2015).
A la fecha, se han propuesto tecnologías de análisis de la marcha para ser empleadas en el cuidado geriátrico, la rehabilitación postquirúrgica y, de manera más controvertida, para el despliegue de publicidades personalizadas en entornos de venta al por menor. Aunque se reconoce su potencial uso para vigilar a trabajadores en entornos de alta seguridad.
En 2018, se informó que las autoridades chinas utilizaban análisis de la marcha basados en la visión, de la empresa de desarrollo de Inteligencia Artificial watrix, como una faceta en sus sistemas de vigilancia pública de circuito cerrado.
El análisis de la marcha también ha sido implementado para monitorear la reflectancia de señales Wi-Fi.
Sin embargo, todos estos enfoques presentan limitaciones inherentes, ya sea porque requieren condiciones óptimas de iluminación, vistas despejadas, equipos especializados con un alto costo, condiciones locales excesivamente específicas o dispositivos portátiles, entre otros posibles obstáculos.
LEE MÁS ARTÍCULOS SOBRE: Noticias de IA.
LEE LA ENTRADA ANTERIOR: Los científicos crean un nuevo algoritmo para el reconocimiento de gestos manuales.
