La esencia de la Inteligencia Artificial: Preservando la calidad en la producción de modelos a través del circuito de retroalimentación de la IA
En la actual era de la Inteligencia Artificial, es esencial la existencia de una sólida y constante verificación del rendimiento de los modelos de IA lanzados en producción. La implementación de un ciclo de retroalimentación puede ser la solución a la necesidad de un rendimiento sostenido y eficiente de dichos modelos.
El valor de la retroalimentación según Elon Musk
Tal como expresó Elon Musk: «Considero que es primordial contar con una correa de retroalimentación, en la que estés pensando permanentemente en lo que has realizado y en cómo podrías hacerlo de mejor manera».
Para mantener la productividad y confiabilidad de los modelos de IA, es vital no solo implementar los modelos, sino también reentrenarlos regularmente con datos del mundo real más recientes. Sin embargo, el auge de la IA generativa está cambiando el panorama del entrenamiento de modelos de IA, que ahora es irregular y susceptible a fallas.
¿La razón? Las fuentes de datos en línea se están convirtiendo en una mezcla de datos generados por humanos y por IA. Hoy en día, blogs con mensajes generados por IA mediante módulos de lenguajes grandes (Large Language Modules o LLM) como ChatGPT o GPT-4 son cada vez más abundantes. Otras fuentes de datos incluyen imágenes generadas por IA creadas con DALL-E2 o Midjourney.
Además, los investigadores de IA están utilizando datos sintéticos creados con IA generativa en sus procesos de formación de modelos. Ante este panorama, surge con fuerza la necesidad de un mecanismo sólido para garantizar la calidad óptima de los modelos de IA, y aquí es donde la importancia del ciclo de retroalimentación de la IA se intensifica.
¿En qué consiste un ciclo de retroalimentación de la IA?
Un ciclo de retroalimentación de la IA es un proceso cíclico donde se recogen y usan continuamente las decisiones y resultados de un modelo de IA para su mejora o reentrenamiento. Esto resulta en un aprendizaje constante y continuado, que posibilita el desarrollo y mejora del modelo en cuestión. En esta dinámica, se actualizan y optimizan los datos de entrenamiento, los parámetros del modelo y los algoritmos del sistema de IA de acuerdo a los datos generados desde dentro del sistema.
Dos tipos fundamentales de retroalimentación de la IA:
1. Retroalimentación positiva de la IA: Sucede cuando los resultados generados por los modelos de IA se alinean con las expectativas y preferencias de los usuarios, quienes consiguen reforzar la precisión de los resultados futuros proporcionando retroalimentación positiva. Entonces, este tipo de retroalimentación se denomina positiva.
2. Retroalimentación negativa de la IA: Se produce cuando los resultados generados por los modelos de IA resultan inexactos. Los usuarios informan errores y este feedback se utiliza para mejorar la estabilidad del sistema y solucionar los problemas detectados.
Estos dos tipos de retroalimentación no se usan de forma aislada, sino que trabajan juntos para ayudar a los modelos de IA a discernir lo que está bien de lo que no.
Fases discurren a través de un circuito de retroalimentación de la IA
Una ilustración detallada del mecanismo de retroalimentación en los modelos de IA. FuenteComprender cómo funcionan los sistemas de retroalimentación de la IA es un hito clave para desbloquear todo el potencial del desarrollo de la IA. Vamos a descifrar las etapas clave que comprende el ciclo de retroalimentación de la IA:
1. Recogida de datos y opiniones: Reunir los resultados relevantes del modelo para su evaluación. Normalmente, se utilizan los comentarios de los usuarios sobre el resultado del modelo para el reentrenamiento, pero también se seleccionan datos externos de la web para ajustar el rendimiento del sistema.
2. Reentrenamiento del modelo: Utilizar la información recopilada para reentrenar el sistema de IA, con el objetivo de proporcionar mejores predicciones y acciones al perfeccionar los parámetros o pesos del modelo.
3. Integración y comprobación: Posteriormente al reentrenamiento, el modelo se testea y evalúa de nuevo. En esta etapa, también se incorporan los comentarios de expertos en la materia para destacar cuestiones más allá de la simple recopilación de los datos.
4. Implementación: El modelo se vuelve a lanzar una vez verificadas las mejoras. En esta fase, el modelo debería mostrar un desempeño mejorado con nuevos datos del mundo real, ofreciendo una experiencia de usuario mejorada.
5. Acompañamiento: El modelo es supervisado permanentemente usando métricas para identificar posibles disfunciones, como la deriva. Y el ciclo de retroalimentación continua.
Desafíos en los datos de producción y los resultados del modelo de IA
La construcción de sistemas de IA resistentes requiere una comprensión profunda de los posibles desafíos que pueden surgir en los datos de producción (es decir, los datos del mundo real) y los resultados del modelo. Presentamos algunos problemas que pueden ser un obstáculo para garantizar la precisión y fiabilidad de los sistemas de la IA:
1. Deriva de los datos: Ocurre cuando el modelo comienza a recibir datos del mundo real de una distribución diferente de la del conjunto de entrenamiento del modelo.
2. Deriva del modelo: Con el paso del tiempo, la eficiencia y las capacidades predictivas del modelo pueden disminuir debido a los cambiantes entornos del mundo real. Este fenómeno se conoce como deriva del modelo.
3. Disonancia entre los resultados del modelo de IA y las decisiones en el mundo real: Los modelos de la IA pueden generar resultados inexactos que no se alinean con las decisiones de los stakeholders en el mundo real.
4. Sesgo y equidad: Los modelos de la IA pueden desarrollar problemas de sesgo y equidad. Un ejemplo es la decisión de Amazon de abandonar un algoritmo de clasificación de currículum vitae debido a la discriminación de género, fenómeno expuesto en una charla TED de Janelle Shane.
El entrenamiento de los modelos de IA con contenido generado por IA puede intensificar aún más estos problemas. ¿Cómo puede suceder esto? Vamos a analizarlo con más detalle.
Circuitos de retroalimentación de la IA en la era del contenido generado por la IA
En los últimos tiempos, los investigadores se han visto envueltos en el estudio de un fenómeno conocido como colapso del modelo, a raíz de la rápida popularización de la IA generativa. Definen el colapso del modelo al aseverar:
«“Se trata de un proceso degenerativo que afecta a generaciones de modelos generativos aprendidos donde los datos generados terminan contaminando el conjunto de datos de entrenamiento de la siguiente generación de modelos. Al ser entrenados con datos contaminados, luego perciben erróneamente la realidad”.»
El colapso del modelo incluye dos casos particulares:
– Colapso temprano del modelo: Sucede cuando el «modelo comienza a perder información sobre las colas de la distribución», es decir, los extremos de la distribución de datos de entrenamiento.
– Colapso del modelo tardío: Aparece cuando el «modelo entrelaza diferentes modos de las distribuciones originales y se aproxima a una distribución que se asemeja a la original, aunque con una variación muy reducida».
Causas del colapso del modelo
A efectos de enfrentar este problema, es importante comprender sus causas, agrupadas en dos grandes categorías:
1. Error de aproximación estadística: Este es el error principal causado por la cantidad finita de muestras y desaparece a medida que la cantidad de muestras se acerca al infinito.
2. Error de aproximación funcional: Este error surge cuando los modelos, como las redes neuronales, no consiguen capturar la función verdadera subyacente que deben aprender a partir de los datos.
Las consecuencias del contenido generado por IA en el ciclo de retroalimentación de la IA
Cuando los modelos de IA se entrenan con contenido generado por IA, tiene un efecto destructivo en los ciclos de retroalimentación de la IA y puede causar numerosos problemas a los modelos de IA reentrenados, como los que enumero a continuación:
– Colapso del modelo: Como se mencionó antes, el colapso del modelo es probable si el circuito de retroalimentación de la IA contiene contenido generado por IA.
– Olvido catastrófico: Un desafío típico en el aprendizaje continuo es que el modelo olvida las muestras anteriores cuando aprende nueva información. Esto se conoce como olvido catastrófico.
– Contaminación de datos: Se refiere a la introducción de datos sintéticos manipulativos en el modelo de la IA para comprometer su rendimiento, incitándolo a producir resultados inexactos.
Creando un circuito de retroalimentación sólido para los modelos de IA en empresas
Las empresas pueden obtener un gran número de ventajas al incorporar circuitos de retroalimentación en sus flujos de trabajo de IA. Aquí están los tres pasos clave a seguir para mejorar el rendimiento de su modelo de IA.
1. Recoja los comentarios de expertos en la materia: Los expertos en la materia están muy versados en su campo y comprenden el uso de modelos de IA. Podrán ofrecer feedback para incrementar la alineación del modelo con la realidad del mundo, aumentando las posibilidades de obtener resultados correctos. Además, ellos podrán gobernar y gestionar mejor los datos generados por IA.
2. Elija las métricas de calidad del modelo adecuadas: Elegir la métrica de evaluación correcta para la tarea en cuestión y supervisar el modelo en producción en base a estas métricas puede mantener la calidad del modelo. Muchos profesionales de la IA también utilizan herramientas MLOps para la evaluación y el monitoreo automatizados y alertar a todos los stakeholders si el rendimiento del modelo comienza a deteriorarse en producción.
3. Manten un riguroso cuidado de los datos: A medida que los modelos en producción se reentrenan con datos nuevos, pueden olvidar información pasada, por lo que es crucial seleccionar datos de alta calidad que se alineen bien con el propósito del modelo. Estos datos se pueden utilizar para volver a entrenar el modelo en futuras generaciones, en conjunto con los comentarios de los usuarios para garantizar la calidad.
LEE MÁS ARTÍCULOS SOBRE: Ciencia de Datos con IA.
LEE LA ENTRADA ANTERIOR: ABBY lanza una campaña internacional para fomentar el desarrollo de una IA confiable.