OpenAI améliore la voix de ChatGPT pour des conversations plus naturelles.
OpenAI a dévoilé un important upgrade de son mode conversationnel vocal pour ChatGPT ce week-end. Cette mise à jour concerne la fonction Advanced Voice, qui permet aux utilisateurs d'interagir oralement avec l'assistant d'intelligence artificielle. Selon la société, les voix de ChatGPT sont désormais plus naturelles et fluides, avec une intonation plus subtile, une cadence plus réaliste (y compris des pauses et des accents) et une expressivité plus précise pour des émotions telles que l'empathie et le sarcasme. Cette évolution s'appuie sur le modèle multilingue natif de GPT-4, introduit par OpenAI l'année dernière. Le système est capable de répondre rapidement aux entrées audio, avec un temps de réaction minimal de 232 millisecondes et une moyenne de 320 millisecondes, ce qui est presque comparable à la vitesse de dialogue humaine. En début d'année, OpenAI avait déjà apporté des améliorations mineures au mode vocal, notamment en réduisant la fréquence des interruptions et en améliorant la gestion des accents. Cette nouvelle mise à jour va encore plus loin en affinant les nuances de ton et en rendant les rythmes de parole plus naturels, particulièrement dans le traitement des pauses et des emphases. Un autre aspect notable de cette mise à jour est l'intégration d'une fonction de traduction améliorée. Les utilisateurs peuvent maintenant demander à ChatGPT de traduire leurs conversations en temps réel, sans interruption, jusqu'à ce qu'ils décident de l'arrêter ou de changer de langue. Cela pourrait réduire la nécessité d'utiliser des applications de traduction vocale spécialisées, offrant une expérience utilisateur plus fluide et intégrée. La fonction Advanced Voice est actuellement disponible pour tous les utilisateurs payants de ChatGPT, sur tous les marchés et toutes les plateformes. Bien que ces améliorations aient considérablement boosté la qualité de l'interaction vocale, OpenAI reconnaît encore quelques limitations. Par exemple, la qualité audio peut connaître des baisses mineures, avec des variations inattendues de ton et de pitch, surtout dans certaines options vocales. De plus, le mode vocal peut parfois produire des sons non souhaités, du charabia ou même de la musique de fond, des bugs liés aux "hallucinations" de l'IA. La société assure qu'elle travaille activement pour améliorer la cohérence audio et résoudre ces problèmes progressivement. Cette mise à jour est significative car elle renforce l'interaction naturelle entre l'IA et les humains, un domaine crucial dans le développement des assistants conversationnels. Elle contribue à rendre les échanges plus intuitifs et humains, réduisant ainsi le fossé entre les technologies d'IA et l'expérience utilisateur. OpenAI continue d'être à la pointe de l'innovation en matière d'IA conversationnelle, avec des avancées qui ont des implications majeures pour l'adoption et l'utilisation future de ces technologies. Les experts de l'industrie saluent ces améliorations, soulignant que la fluidité et la naturalité des interactions vocales sont essentielles pour l'acceptation et l'efficacité des assistants IA. Ils prévoient que ces améliorations pourraient accélérer l'adoption de ChatGPT dans des domaines tels que l'éducation, la santé, et les services client. OpenAI, connue pour ses contributions constantes à l'IA, reste un acteur clé dans le développement de technologies conversationnelles avancées. Cette mise à jour est une étape importante vers une interaction plus humaine et intuitive, ce qui pourrait avoir des répercussions positives sur la manière dont les gens perçoivent et utilisent l'IA dans leur vie quotidienne.