OpenAI presenta ChatGPT-4o, una nueva versión que admite conversaciones naturales por voz

Tecnología

Es un modelo multimodal capaz de mantener conversaciones habladas de un modo que recuerda mucho a lo retratado en la película 'Her'

Entiende el sarcasmo, es capaz de "percibir la emoción" de un usuario nervioso, hace bromas y muestra un amplio rango de estilos y tonos en su voz

Apple ultima un acuerdo con OpenAI para incorporar ChatGPT en iOS 18

OpenAI presenta ChatGPT-4o

La empresa de inteligencia artificial (IA) OpenAI presentó este lunes ChatGPT-4o, una nueva versión más rápida y con capacidades mejoradas de su popular chatbot.

La jefa tecnológica Mira Murati, en una sesión abierta y retransmitida por internet, dijo que esta versión de la herramienta "mejora sus capacidades en texto, visión y audio", y que supone un "gran paso adelante" en su facilidad de uso.

El máximo ejecutivo de OpenAI, Sam Altman, destacó en la red social X que GPT-4o, el modelo en que se basa, es el mejor hasta la fecha, "multimodal", y que estará disponible para todos los usuarios, incluidos los del plan gratuito (entre otras mejoras que se incorporarán a las cuentas gratuitas).

"Hasta ahora, los modelos de clase GPT-4 sólo estaban disponibles para gente que paga una suscripción mensual. Eso es importante para nuestra misión, queremos poner grandes herramientas de IA en las manos de todos", agregó.

Sin embargo, como es lógico, no todas las características serán gratuitas y los usuarios que no pasen por caja tendrán limitaciones en el uso de las funcionalidades gratuitas.

Una de esas funcionalidades reservadas a los usuarios premium será el nuevo modo de voz, que se mostró en la presentación online, con una voz femenina y un tipo de conversación natural que recordaba mucho a la película Her, de Spike Jonze, sobre un humano que se enamora de una IA.

"Queremos eliminar el misticismo de la tecnología y llevársela para que puedan probarla ustedes mismos. En las próximas semanas, implementaremos estas capacidades para todos", dijo Murati, que adelantó que pronto habrá también novedades sobre "la siguiente frontera" en la IA.

Percibe emociones y entiende el sarcasmo

La nueva versión de ChatGPT fue capaz de "percibir la emoción" de un usuario nervioso, le recomendó hacer respiraciones, bromeó con que parecía "una aspiradora", entiende el sarcasmo y mostró un rango de estilos y tonos en su voz leyendo un cuento para niños.

Entre otras cosas, el chatbot ahora puede ser interrumpido y responder inmediatamente sin tardar segundos, resolver problemas matemáticos a través de vídeo, o hacer interpretación y traducción simultánea de idiomas de viva voz.

Nueva interfaz y aplicación de escritorio para Mac

Murati también señaló que el nuevo modelo GPT-4o ofrece una nueva interfaz de usuario (IU) y una nueva aplicación de escritorio de ChatGPT (por ahora para macOS) para que todos "puedan usarlo allá donde estén" y se "integre fácilmente en la rutina de trabajo".

Asimismo, estará disponible para desarrolladores a través de la interfaz de programación de aplicaciones (API) de OpenAI con el objetivo de que estos puedan construir apps usándolo, según dijo.

La víspera del evento de Google

En el evento de OpenAI, programado un día antes de la conferencia de desarrolladores de Google, colaboró la tecnológica NVIDIA, otra líder en IA, pues Murati agradeció a esa empresa y a su ejecutivo, Jensen Huang, haber brindado "los procesadores más avanzados".

Se espera que este martes Google, rival de OpenAI, haga anuncios sobre su herramienta de IA que compite con ChatGPT, llamada Gemini.

stats