Saltar al contenido

OpenAgents: Una Plataforma Abierta para Agentes de Lenguaje en la Naturaleza

27/12/2023
Openagents Una Plataforma Abierta Para Agentes De Lenguaje En La

OpenAgents: Una plataforma abierta para agentes de lenguaje en la vida real

El panorama tecnológico reciente ha mostrado que los agentes de lenguaje, particularmente aquellos basados en grandes modelos de lenguaje (LLMs), tienen la capacidad para ejecutar una amplia gama de tareas complejas en entornos diversos utilizando lenguaje natural. Sin embargo, el enfoque principal de la mayoría de las estructuras de agentes de lenguaje actualmente es facilitar la construcción de agentes de lenguaje conceptuales. Esta atención a menudo se desvía hacia las aplicaciones y frecuentemente desatiende la accesibilidad de estos agentes para los usuarios no expertos.

Con el objetivo de superar las limitaciones existentes que experimentan los agentes de lenguaje, los desarrolladores han creado la plataforma OpenAgents, una plataforma de despliegue y alojamiento de agentes de lenguaje en entornos reales y para un sinfín de tareas cotidianas. OpenAgents se construye alrededor de tres agentes:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded
  • Agente de Datos: Asiste con el Análisis de Datos utilizando herramientas de datos, lenguajes de consulta como SQL o lenguajes de programación como Python.
  • Agentes de Plugins: Proporciona acceso a más de 200 herramientas API útiles para tareas cotidianas.
  • Agentes Web: Ayudan a navegar en la web manteniendo el anonimato del usuario.

OpenAgents utiliza una interfaz de usuario web optimizada para errores comunes y respuestas rápidas con el objetivo de permitir que los usuarios generales interactúen con las funcionalidades del agente. Al mismo tiempo, ofrece a investigadores y desarrolladores una experiencia de implementación fluida en sus configuraciones locales. Podríamos decir que OpenAgents es un intento de proporcionar una base sólida para facilitar las evaluaciones del mundo real y la creación de agentes de lenguaje innovadores, efectivos y avanzados.

OpenAgents y Agentes de Lenguaje: Introducción

Los agentes de lenguaje, en esencia, provienen de los agentes inteligentes. Estos agentes inteligentes se conceptualizan para poseer habilidades de resolución de problemas autónomos, junto con la capacidad de percibir su entorno, tomar decisiones y actuar en consecuencia. Con los avances en los grandes modelos de lenguaje, la comunidad de desarrollo global ha aprovechado el concepto de agentes inteligentes y LLMs para crear agentes de lenguaje. Estos agentes utilizan la programación de lenguaje natural (NLP) para realizar una amplia gama de tareas complejas en entornos diversos, y recientemente han mostrado un potencial notable.

Las estructuras actuales de los agentes de lenguaje, como Gravitas y Chase, proporcionan principalmente una interfaz de consola diseñada para desarrolladores, junto con implementaciones conceptuales. Sin embargo, a menudo limitan la accesibilidad a un público más amplio, especialmente aquellos que no están familiarizados con la codificación. Además, los estándares actuales de los agentes están construidos por desarrolladores con requisitos específicos para la evaluación determinista, especialmente en escenarios que requieren navegación web, codificación, utilización de herramientas o combinaciones de estos.

En un esfuerzo por desarrollar agentes inteligentes y de lenguaje impulsados por LLM para una base de usuarios más amplia, actores consolidados como OpenAI y Microsoft han desplegado una gama de productos bien diseñados, incluido el Análisis de Datos Avanzados, también conocido como Intérprete de Código, y plugins de navegadores. Aunque estos agentes son efectivos en sus funciones, ofrecen ayuda limitada a la comunidad de desarrollo. Esta limitación surge porque el código de la lógica de negocio y las implementaciones del modelo no han sido de código abierto, lo que limita las oportunidades para que los desarrolladores e investigadores los exploren más, así como también limita el acceso gratuito para los usuarios.

Diseño e Implementación de la Plataforma OpenAgents

La arquitectura o diseño sistemático de la plataforma OpenAgents se puede dividir en dos componentes principales: Interfaz de Usuario, incluyendo tanto el backend como el frontend, y Agente de Lenguaje, compuesto por herramientas, modelos de lenguaje y entornos. OpenAgents proporciona una interfaz para la comunicación entre los usuarios y los agentes. El flujo de interacción en la plataforma es el siguiente.

Los agentes utilizan las herramientas disponibles para planificar y tomar las acciones necesarias en los entornos una vez que hayan recibido las entradas de los usuarios. La arquitectura o diseño sistemático de la plataforma se ilustra en la imagen a continuación.

openagents: una plataforma abierta para agentes de lenguaje en la naturaleza

Interfaz de Usuario

Los desarrolladores de la plataforma OpenAgents han dedicado mucho tiempo y esfuerzo en crear una interfaz de usuario (UI) fácil de usar y altamente funcional después de manejar una multitud de agentes anfitriones y lógica de negocio reutilizable. Como resultado, OpenAgents ofrece soporte para una amplia variedad de tareas técnicas que incluyen el manejo de errores, operaciones de servidores de backend, transmisión de datos y mucho más, con el objetivo principal de hacer que OpenAgents sea fácil de usar pero altamente efectiva y utilizable al mismo tiempo.

Agente de Lenguaje

Dentro de la plataforma OpenAgents, el agente de lenguaje tiene tres componentes esenciales: una interfaz de herramientas, un modelo de lenguaje y el entorno en sí. El método de comandos implementado en OpenAgents crea un proceso secuencial para que los agentes sigan que comienza con Observación → Deliberación → Acción. La plataforma también motiva al LLM a generar texto analizable con mayor eficiencia, y la interfaz de herramientas consta de analizadores que pueden traducir estos textos generados por los LLMs en acciones ejecutables como hacer llamadas a la API o generar código. Luego, el marco ejecuta estas acciones dentro de los límites del entorno correspondiente.

Agentes de OpenAgents

En el centro de OpenAgents, hay tres agentes distintos: Agente de Datos que ayuda con el Análisis de Datos utilizando herramientas de datos, lenguajes de consulta como SQL o lenguajes de programación como Python, Agentes de Plugins que ayuda al proporcionar acceso a más de 200 herramientas API útiles para tareas diarias, Agentes Web que ayuda a navegar en la web manteniendo el anonimato de su usuario. Estos agentes tienen experiencia de dominio individual similar a los complementos de ChatGPT, sin embargo, a diferencia de ChatGPT, la implementación en OpenAgents se basa puramente en la parte superior de la interfaz de programación de aplicaciones de lenguaje abierta.

Aplicaciones prácticas y despliegue en el mundo real de OpenAgents

En esta sección, hablaremos sobre la trayectoria de la plataforma OpenAgents desde la teorización hasta el despliegue en el mundo real, junto con los desafíos encontrados y los aprendizajes adquiridos en las complejidades de la evaluación que los desarrolladores abordaron.

Para concluir, en este artículo hemos hablado sobre la plataforma OpenAgents, una plataforma de implementación y alojamiento abierta para agentes de lenguaje en entornos reales y para una gran cantidad de tareas cotidianas. OpenAgents ofrece a los investigadores y desarrolladores una experiencia de implementación fluida en sus propias configuraciones. Al proporcionar una plataforma transparente, integral y capaz de ser implementada, OpenAgents pretende hacer accesible el potencial de los LLM a un rango más amplio de usuarios, no limitado a investigadores y desarrolladores, sino también a usuarios finales con limitada experiencia técnica.

LEE MÁS ARTÍCULOS SOBRE: Ciencia de Datos con IA.

LEE LA ENTRADA ANTERIOR: El V6 de Midjourney introduce una nueva era de generación de imágenes con IA.