
Avances en reconocimiento de habla humana: Investigadores proponen un modelo basado en aprendizaje automático y redes neuronales profundas
Innovadora iniciativa de un conjunto germano de expertos en tecnología
Un equipo de expertos germanos se encuentra trabajando activamente en el desarrollo de un innovador modelo de reconocimiento del habla humana que aprovecha el poder del aprendizaje automático y las redes neuronales profundas. Esta propuesta revolucionaria provee una promesa significativa para impulsar significativamente el avance en la detección de patrones de habla humana.
De manera habitual, la optimización del reconocimiento del habla se beneficia de algoritmos usados en la formulación de audífonos, mediante la realización repetida de pruebas que establecen la correlación entre la señal y el ruido, asemejándolo a la cantidad precisa de palabras que se pueden discernir. Pese a ello, este proceso es habitualmente muy dispendioso en tiempo y recursos.[automatic_youtube_gallery type="search" search="Desarrollan un modelo de reconocimiento de habla humana con redes neuronales profundas" cache="2419200" per_page="1" thumb_excerpt="0" player_description="0"]
La descripción detallada de este modelo revolucionario se publicó recientemente en La Revista de la Sociedad Acústica de América.
Modelo con alto rendimiento de predicción para dificultades auditivas
Jana Roßbach, una de las investigadoras principales de la Universidad Carl Von Ossietzky, explica que su propuesta revolucionaria se distingue por el alto grado de precisión de las predicciones que proporciona a personas con dificultades auditivas y para diversas complicaciones de ruido, demostrando bajos márgenes de error y correlaciones muy altas con los datos recogidos.
El conjunto de científicos contempló cuántas palabras logra comprender un oyente por frase a través del reconocimiento automático de voz (ASR). Dispositivos y herramientas como Alexa y Siri utilizan este ASR que se encuentra disponible de manera extendida.
El desarrollo y conclusiones del estudio
En el estudio participó un total de 28 personas, 8 con audición normal y 20 con dificultades auditivas. Los participantes fueron sometidos a una variedad de ruidos complejos que encubrían el habla, y los con discapacidad auditiva se clasificaron en tres conjuntos, de acuerdo con su grado de pérdida de audición relacionada con la edad.
Mediante su innovador modelo, los investigadores lograron anticipar con certeza los resultados del reconocimiento de habla humana para sus participantes con dificultades auditivas en diferentes grados de pérdida de audición, para varios encubridores de ruido con distintas complejidades en la modulación temporal y coincidencias con el habla real. Esto ofreció datos reveladores para analizar cada persona en caso de potencial pérdida de audición.
Roßbach se mostró sorprendida y satisfecha con las predicciones del modelo, que funcionaron adecuadamente para todos los tipos de ruido. El equipo de investigación ahora se encuentra trabajando en el desarrollo de un modelo binaural, enfocado en la audición con ambos oídos. Por otro lado, indicaron que el nuevo modelo también podría aplicarse para la anticipación del esfuerzo auditivo o la calidad del habla.
