
12 Cosas impactantes que la gente ya ha construido (acceso anticipado) con OpenAI
Las recientes innovaciones de OpenAI, especialmente en el OpenAI DevDay de 2023, indican una transformación inminente en nuestra interacción con la inteligencia artificial. Herramientas como AGI.zip y WebcamGPT destacan por su rapidez y precisión en tiempo real. Las aplicaciones prácticas de GPT-4 Vision en la transcripción y resumen de contenidos extensos, así como en la creación de sitios web HTML desde maquetas, evidencian su potencial disruptivo. Además, la API de Asistentes y la capacidad de GPT-4V para servir como instructor de yoga o narrador deportivo con TTS demuestran la diversidad y adaptabilidad de estas tecnologías avanzadas. Estos avances subrayan el compromiso de OpenAI con la experiencia, autoridad y confiabilidad.

OPENAI DEVDAY:
Según los informes que hemos analizado, el OpenAI DevDay promete ser un hito significativo en el campo de la inteligencia artificial para 2023. Está previsto que las innovaciones en la forma en que interactuamos con ChatGPT alteren considerablemente nuestra experiencia actual. A continuación, compartimos con ustedes las informaciones preliminares que hemos recabado meticulosamente sobre este tema. Cabe destacar que, aunque las fuentes no están oficialmente confirmadas, nuestra investigación previa al evento sugiere que la mayoría de estas, basadas en datos históricos de lanzamientos previos, han probado ser confiables.
OpenAI DevDay podría ser el evento de IA más destacado de 2023. La interacción con ChatGPT se transformará de manera significativa. He aquí las filtraciones no confirmadas que conocemos:
1.- Un comentarista de deportes electrónicos creado con el nuevo GPT-4V y la API de texto a voz.
¡Usé la nueva @OpenAI Vision API + TTS para comentar un juego de @LeagueOfLegends!
THIS IS DOPE.
— peter! 🥷 (@pwang_szn) November 7, 2023
I used the new @OpenAI Vision API + TTS to commentate a @LeagueOfLegends game!! pic.twitter.com/lwRmiKdzPF
2. AGI.zip, el primer GPT personalizado construido en el nuevo GPT Builder que mejora la velocidad del nuevo GPT-4 Turbo.
Introduciendo:
Agi.zip
El primer agente GPT personalizado del mundo
GPT-4-turbo no es lo suficientemente rápido
Así que incluí 20 hotkeys preconstruidos para IR MÁS RÁPIDO
Guardado automático de:
- memoria a largo plazo
- habilidades reutilizables
- seguimiento de tareas actuales
- exportación a cualquier chat usando .sql
Pruébalo tú mismo, enlace AQUI
Introducing:
— Nick Dobos (@NickADobos) November 6, 2023
Agi . zip
World's 1st custom GPT agent
GPT-4-turbo isn't fast enough
So I included 20 prebuilt hotkeys to GO FASTER
Automatically save
-long term memory
-reusable skills
-tracks current tasks
-export into any chat using .sql
try it yourself, link below pic.twitter.com/9brNHNZYkZ
3.- Un GPT personalizado construido con el nuevo GPT Builder para crear listas de reproducción musicales a partir de tus alineaciones de conciertos favoritas.
La capacidad de combinar la navegación web con GPTs es impresionante.
Aquí le pido que navegue por la web para encontrar la alineación de este año de Coachella y crear una lista de reproducción con lo más destacado.
Being able to combine web browsing with GPTs is wild
— Brett Bauman (@brettunhandled) November 6, 2023
Here I ask it to browse the web to find this years coachella lineup and make a playlist of the highlights
link below pic.twitter.com/oiqTFLhjf5
4.- Captura de pantalla de cualquier sitio web y pregunta cualquier cosa construida con la nueva API GPT-4V
Captura de pantalla y haz preguntas sobre CUALQUIER COSA con GPT4 Vision integrado al navegador. Puede:
- 📑 interpretar cualquier captura de tabla
- 🫁 Ayudarte a aprender temas visuales como la anatomía
- 🚗 ¿Qué elemento es este del coche? GPT sabe la respuesta
- ❓elige el tuyo
👇Demostración y Beta👇
cc: @gdb
Screenshot & Ask questions about ANYTHING
— Robert Lukoshko — e/acc (@Karmedge) November 7, 2023
GPT4 Vision came browser. It can:
– 📑 interpret any table capture
– 🫁 Help you learn visual subjects like anatomy
– 🚗 What is this car element? GPT knows the answer
– ❓pick yours
👇Demo & Beta👇
cc: @gdb pic.twitter.com/TGbITxg68K
5.- Utilizando GPT-4V + la nueva API de texto a voz para crear un narrador deportivo AI
GPT-4V + TTS = Narrador deportivo AI 🪄⚽️
Pasé cada fotograma de un video de fútbol a gpt-4-vision-preview, y con algunas indicaciones simples se pidió que generara una narración.
Sin ediciones, esto es tal como salió del modelo (es decir, puede ser MUCHO MEJOR).
GPT-4V + TTS = AI Sports narrator 🪄⚽️
— Gonzalo Espinoza Graham 🏴☠️ (@geepytee) November 7, 2023
Passed every frame of a football video to gpt-4-vision-preview, and with some simple prompting asked to generate a narration
No edits, this is as it came out from the model (aka can be SO MUCH BETTER) pic.twitter.com/KfC2pGt02X
6.- Creando un nuevo GPT usando GPT Builder para optimizar publicaciones de X
Acabo de probar el nuevo GPT Builder de OpenAI. Creé ‘X Optimizer GPT’ que ajusta mis publicaciones y determina los momentos pico de publicación para el máximo compromiso en X.
¿Los resultados? Asombrosos. 🤯
Just tested OpenAI's new GPT Builder.
— Rowan Cheung (@rowancheung) November 6, 2023
Created 'X Optimizer GPT' which fine-tunes my posts and pinpoints peak posting times for max engagement on X.
The results? Mind-blowing. 🤯 pic.twitter.com/9TpGZ3LMq7
7.- «Roast My Website» construido usando la API GPT-4V y la nueva API de texto a voz
¿No es genial el futuro?
Construí «Roast my Website» usando las recién anunciadas APIs de OpenAI.
GPT4 Vision analiza la captura de pantalla y la critica, mientras que la nueva API de texto a voz la devuelve en audio.
Échale un vistazo (con audio para escuchar la crítica) 🌶️
Isn't the future great?
— Marcel Pociot 🧪 (@marcelpociot) November 6, 2023
I built "Roast my Website" using the newly announced OpenAI APIs.
GPT4 Vision analyzes the screenshot and roasts it, while the new text-to-speech API returns it as audio.
Check it out (with audio to hear the roast) 🌶️ pic.twitter.com/pqJPFJt03g
8.- WebcamGPT, construido usando la nueva API GPT-4V en 10 minutos
GPT reconoce lo que está sucediendo en tu cámara en tiempo real.
WebcamGPT: La API GPT-4 Vision reconoce lo que está sucediendo en tiempo casi real, identifica objetos y acciones…
Esto tomó alrededor de 10 minutos en construir. Está en funcionamiento.
Comenta si quieres acceso.
WebcamGPT:
— Benjamin De Kraker (@BenjaminDEKR) November 7, 2023
GPT-4 Vision API recognizes what is happening in near-realtime, identifies objects and actions…
This took about 10 minutes to build. It's live.
Comment if you want access. pic.twitter.com/iduUyo3sWQ
9.- GPT vs. GPT construido con la nueva API de Asistentes
La API de Asistentes es impresionante, tenía que construir algo…
Código abierto de «GPTvsGPT» 🕵️🕵️. (109 líneas de código). Es una plantilla simple para que dos Asistentes de IA conversen. Lo emocionante es la capacidad de ampliar estos con recuperación, datos y funciones personalizadas.
GH/Replit en el hilo 🔽
The Assistants API is awesome, had to build something…
— Yohei (@yoheinakajima) November 7, 2023
Open-sourcing "GPTvsGPT" 🕵️🕵️
(109 lines of code)
A simple template to have two AI Assistants converse. What's exciting is the ability to extend these with retrieval, data, and custom functions.
GH/Replit in thread 🔽 pic.twitter.com/6LHiTZ3RDO
10.- Usa la nueva API GPT-4 Vision para ser tu instructor de yoga
ChatGPT Vision con Yoga. ¿Estoy haciendo bien esta posición? No necesitas volver a pagar por un instructor
GPT4V está aquí para ti.
ChatGPT Vision with Yoga
— Robert Lukoshko — e/acc (@Karmedge) November 7, 2023
Am I doing this position right?
You don't need to pay for instructor ever
GPT4V is here for you pic.twitter.com/lLBWbddec6
11.- Diseño de maqueta a sitio web completo en HTML en segundos
Imagina cuántas herramientas de IA para diseño-a-sitio web estamos a punto de ver.
La GPT-4-Vision de @OpenAI es un cambio de juego literal. Pude armar este flujo de hacer una maqueta de baja fidelidad -> HTML real en menos de <5 horas de que la API estuviera disponible. El futuro es brillante.
@OpenAI's GPT-4-Vision is a literal game changer. I was able to hack together this flow of doing low fidelity mock up -> actual html in like < 5 hours of the api being available. The future is bright. pic.twitter.com/g7GhLJS19A
— Sawyer Hood (@sawyerhood) November 7, 2023
12.- Transcribiendo y resumiendo una conferencia completa de video de YouTube con la nueva ventana de contexto de 128k.
Wow, la nueva ventana de contexto de ChatGPT es INCREÍBLE. Devora una transcripción completa de YouTube y la resume, y se expande cuando es necesario. Aún no puede hacer GPT’s. Lo siguiente es tener un podcast con el TTS con Transcripciones de YouTube como contexto.
Cosas divertidas con @OpenAI
Wow, ChatGPT new context window is AMAZING.
— Riley Brown (@rileybrown_ai) November 6, 2023
It devours a full youtube transcript and summarizes it, and expands when needed.
Still can't make GPT's.
Next up is having a podcast with the TTS with YouTube Transcripts as context.
Fun Stuff @OpenAI pic.twitter.com/HnkKLpDuto
Este es solo el comienzo de muchos casos de uso alucinantes que veremos en los próximos meses. Sígue a @rowancheung que es el autor e este hilo tan bien «hilado» 🙂
Como revisión final, las innovaciones presentadas por OpenAI en 2023 están configuradas para volvernos la cabeza del revés con la forma en que interactuamos con la inteligencia artificial. Desde comentaristas de deportes electrónicos mejorados por GPT-4V y API de texto a voz, hasta herramientas como AGI.zip y WebcamGPT, que mejoran la interacción y eficiencia en tiempo real. Además, la capacidad de GPT para transcribir y resumir contenido de larga duración como conferencias en video, y su aplicación en el desarrollo web con la conversión de maquetas a HTML, demuestran su versatilidad. La API de Asistentes y GPT-4 Vision ofrecen posibilidades sin precedentes para el desarrollo de aplicaciones personalizadas, incluyendo la enseñanza de yoga y la narración deportiva con TTS. Estos avances no solo reflejan la experiencia y autoridad de OpenAI en el campo de la IA, sino que también establecen un nuevo estándar de confiabilidad y funcionalidad para usuarios y desarrolladores por igual. El futuro de la IA, impulsado por estos desarrollos, promete ser brillante y accesible para una gama más amplia de aplicaciones prácticas.
Casos de Uso:
Caso de Uso | Descripción Técnica |
---|---|
Comentarista de deportes electrónicos | Uso de GPT-4V y API de texto a voz |
Optimizador de publicaciones ‘X’ | GPT Builder para determinar tiempos de publicación |
Instructor de yoga AI | API GPT-4 Vision para seguimiento de posturas |
Narrador deportivo AI | GPT-4V y TTS para narración en tiempo real |
Transcripción de videos | Uso de la ventana de contexto de 128k de ChatGPT |
Diseño de sitios web | GPT-4 Vision para conversión de mock-ups a HTML |
Ventajas y Desventajas:
Ventajas | Desventajas |
---|---|
✅ Mejora en la velocidad de procesamiento | ❌ Dependencia de tecnología avanzada |
✅ Personalización de funciones | ❌ Curva de aprendizaje para nuevos usuarios |
✅ Automatización de tareas repetitivas | ❌ Posibles errores en interpretación de datos |
✅ Accesibilidad a través de múltiples dispositivos | ❌ Necesidad de conexión a internet constante |
Preguntas Frecuentes:
FAQs | Respuesta |
---|---|
¿Es fácil de usar el GPT Builder? | Sí, está diseñado para ser intuitivo. |
¿Puede el GPT-4V interpretar cualquier imagen? | Tiene límites, pero es bastante avanzado. |
¿El sistema puede mejorar con el tiempo? | Absolutamente, aprende de interacciones pasadas. |
¿Cómo afecta la privacidad el uso de GPT-4V? | Se toman medidas para proteger la privacidad de los usuarios. |
¿Se puede usar GPT para fines educativos? | Sí, especialmente en el aprendizaje visual y a distancia. |
LEE MÁS ARTÍCULOS SOBRE: Mejores Herramientas IA.
LEE LA ENTRADA ANTERIOR: Acciones de inteligencia artificial: las 10 mejores empresas de IA.