Inteligencia Artificial

OpenAI introduce la capacidad de voz a ChatGPT: el chatbot ahora conversará con los usuarios

Por

Mundo HR

OpenAI introduce la capacidad de voz a ChatGPT: el chatbot ahora conversará con los usuarios

Copiado

OpenAI ha lanzado una innovadora actualización para ChatGPT que revolucionará la manera en que los usuarios interactúan con la inteligencia artificial. El nuevo modelo permite que el chatbot no solo responda mediante texto, sino que ahora también puede hablar con los usuarios, comprender contenido en video y texto, y realizar análisis más complejos.

Durante un evento reciente, Mira Murati, CTO de OpenAI, destacó que esta actualización no solo es más rápida sino que también mejora las capacidades de ChatGPT en texto, visión y audio. Este avance estará disponible gratuitamente para todos los usuarios.

‍

ChatGPT adquiere la capacidad de hablar

Una de las funciones más destacadas del nuevo modelo GPT-4o es su capacidad "nativamente multimodal". Esto significa que puede generar y comprender comandos no solo en texto, sino también en voz e imágenes. Esta característica amplía significativamente las posibilidades de interacción entre los humanos y la IA.

Antes del anuncio de GPT-4o, se especulaba sobre los posibles desarrollos de OpenAI, como un motor de búsqueda de IA para competir con Google o un asistente de voz integrado. Sin embargo, OpenAI decidió enfocarse en mejorar la experiencia del usuario con la inclusión de la voz en ChatGPT, proporcionando una interacción más intuitiva y natural. Ahora, los usuarios pueden comunicarse con el sistema a través de comandos de voz, y el modelo puede responder en tiempo real, incluso captando y replicando emociones en la voz del usuario.

‍

‍Disponibilidad y capacidades ampliadas

OpenAI ha confirmado que GPT-4o estará disponible de forma gratuita para todos los usuarios de ChatGPT, mientras que los suscriptores pagos tendrán acceso a mayores capacidades. La adición de la voz no solo mejora la experiencia del usuario, sino que también amplía las funcionalidades de la plataforma, permitiendo interacciones más dinámicas y versátiles.

Además de las mejoras en la voz, GPT-4o también potencia las capacidades de visión de ChatGPT. Ahora, el sistema puede analizar imágenes y proporcionar información relevante o respuestas a consultas específicas. Esto convierte a ChatGPT en una herramienta aún más poderosa y multifuncional.

Los desarrolladores también se beneficiarán de GPT-4o, ya que OpenAI ofrecerá acceso al modelo a través de su API, permitiendo integrar estas nuevas capacidades de voz en sus propias aplicaciones y sistemas. Esta API será más rápida y económica que su predecesora, GPT-4 Turbo, lo que facilitará el desarrollo de nuevas aplicaciones basadas en IA.

‍

ChatGPT con voz se podrá usar:

Para ilustrar las capacidades de esta actualización, OpenAI presentó diversos ejemplos prácticos:
Charla casual: ChatGPT puede sostener conversaciones fluidas y naturales, respondiendo en tiempo real con un tono amigable y cercano, sin necesidad de convertir la voz en texto primero.
Traducción en tiempo real: Durante la presentación, ChatGPT demostró su habilidad para interpretar y traducir conversaciones en diferentes idiomas instantáneamente, una herramienta útil para viajes y reuniones internacionales.
Análisis de imágenes: Utilizando la cámara del usuario, ChatGPT puede resolver problemas matemáticos, identificar objetos y hasta jugar a piedra, papel o tijera.
Análisis de códigos y gráficos: El chatbot puede comprender y analizar códigos de programación, proporcionando respuestas de manera más fluida mediante la voz, además de analizar imágenes de la computadora para generar contenido.

‍

Impacto en el Futuro del Trabajo

La integración de la voz en ChatGPT marca un hito significativo en la evolución de las herramientas de IA en el ámbito laboral. Esta capacidad permite una interacción más rápida y eficiente, facilitando tareas complejas como la gestión de proyectos, la creación de contenido y la asistencia técnica. Los trabajadores podrán delegar tareas rutinarias a ChatGPT, aumentando su productividad y permitiéndoles concentrarse en actividades más estratégicas y creativas.

‍

Uso potencial en Recursos Humanos

En el campo de Recursos Humanos, la capacidad de ChatGPT para comprender y responder en voz abre nuevas posibilidades. Podría automatizar procesos de selección de personal, realizar entrevistas preliminares, proporcionar formación y responder preguntas frecuentes de los empleados. Además, su habilidad para interpretar emociones en la voz del usuario puede mejorar la detección de problemas laborales y la implementación de soluciones proactivas, contribuyendo a un entorno de trabajo más eficiente y armonioso.