OpenAI ha lanzado una innovadora actualización para ChatGPT que revolucionará la manera en que los usuarios interactúan con la inteligencia artificial. El nuevo modelo permite que el chatbot no solo responda mediante texto, sino que ahora también puede hablar con los usuarios, comprender contenido en video y texto, y realizar análisis más complejos.
Durante un evento reciente, Mira Murati, CTO de OpenAI, destacó que esta actualización no solo es más rápida sino que también mejora las capacidades de ChatGPT en texto, visión y audio. Este avance estará disponible gratuitamente para todos los usuarios.
Una de las funciones más destacadas del nuevo modelo GPT-4o es su capacidad "nativamente multimodal". Esto significa que puede generar y comprender comandos no solo en texto, sino también en voz e imágenes. Esta característica amplía significativamente las posibilidades de interacción entre los humanos y la IA.
Antes del anuncio de GPT-4o, se especulaba sobre los posibles desarrollos de OpenAI, como un motor de búsqueda de IA para competir con Google o un asistente de voz integrado. Sin embargo, OpenAI decidió enfocarse en mejorar la experiencia del usuario con la inclusión de la voz en ChatGPT, proporcionando una interacción más intuitiva y natural. Ahora, los usuarios pueden comunicarse con el sistema a través de comandos de voz, y el modelo puede responder en tiempo real, incluso captando y replicando emociones en la voz del usuario.
OpenAI ha confirmado que GPT-4o estará disponible de forma gratuita para todos los usuarios de ChatGPT, mientras que los suscriptores pagos tendrán acceso a mayores capacidades. La adición de la voz no solo mejora la experiencia del usuario, sino que también amplía las funcionalidades de la plataforma, permitiendo interacciones más dinámicas y versátiles.
Además de las mejoras en la voz, GPT-4o también potencia las capacidades de visión de ChatGPT. Ahora, el sistema puede analizar imágenes y proporcionar información relevante o respuestas a consultas específicas. Esto convierte a ChatGPT en una herramienta aún más poderosa y multifuncional.
Los desarrolladores también se beneficiarán de GPT-4o, ya que OpenAI ofrecerá acceso al modelo a través de su API, permitiendo integrar estas nuevas capacidades de voz en sus propias aplicaciones y sistemas. Esta API será más rápida y económica que su predecesora, GPT-4 Turbo, lo que facilitará el desarrollo de nuevas aplicaciones basadas en IA.
ChatGPT con voz se podrá usar:
La integración de la voz en ChatGPT marca un hito significativo en la evolución de las herramientas de IA en el ámbito laboral. Esta capacidad permite una interacción más rápida y eficiente, facilitando tareas complejas como la gestión de proyectos, la creación de contenido y la asistencia técnica. Los trabajadores podrán delegar tareas rutinarias a ChatGPT, aumentando su productividad y permitiéndoles concentrarse en actividades más estratégicas y creativas.
En el campo de Recursos Humanos, la capacidad de ChatGPT para comprender y responder en voz abre nuevas posibilidades. Podría automatizar procesos de selección de personal, realizar entrevistas preliminares, proporcionar formación y responder preguntas frecuentes de los empleados. Además, su habilidad para interpretar emociones en la voz del usuario puede mejorar la detección de problemas laborales y la implementación de soluciones proactivas, contribuyendo a un entorno de trabajo más eficiente y armonioso.