OpenAI ouvre la voie à des conversations réalistes avec des chatbots grâce au mode vocal avancé de ChatGPT. L’entreprise nous permettra de correspondre avec l’IA comme un humain et de lui parler désormais comme un humain. Jetons un œil au mode vocal avancé de ChatGPT, qui n’est actuellement disponible que pour un nombre limité de membres Plus.
Cette fonctionnalité de pointe, qui va révolutionner la façon dont nous interagissons avec l’IA, suscite un débat presque aussi intéressant que la technologie elle-même. Hé, Jarvis, tu es là ?
Nous commençons à déployer le mode vocal avancé auprès d’un petit groupe d’utilisateurs de ChatGPT Plus. Le mode vocal avancé offre des conversations plus naturelles et en temps réel, vous permet d’interrompre à tout moment et détecte et réagit à vos émotions. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30 juillet 2024
Mode vocal avancé de ChatGPT : bien plus que de simples conversations
Le dernier produit d’OpenAI n’est pas ordinaire assistant vocalLe mode vocal avancé de ChatGPT est censé offrir des réponses vocales hyper réalistes qui brouillent la frontière entre les humains et l’IA. Contrairement à son prédécesseur, qui s’appuyait sur trois modèles distincts pour traiter les entrées vocales, GPT-4o (le moteur derrière cette nouvelle fonctionnalité) est capable d’effectuer des tâches multimodales en une seule fois. Imaginez une machine capable de gérer la conversion de la voix en texte, le traitement des invites et la sortie de texte en parole en une seule fois. Des conversations fluides qui vous font oublier que vous avez une conversation avec un robot ne sont pas loin.
Mais attendez, ce n’est pas tout ! Cette boîte de discussion IA prétend pouvoir détecter les intonations émotionnelles ; elle peut dire si vous vous sentez triste ou excité. Elle peut même vous rejoindre pour une séance de karaoké, mais ne vous attendez pas à ce qu’elle chante des airs protégés par des droits d’auteur. Voyons d’abord comment utiliser le mode vocal avancé de ChatGPT.
Comment utiliser le mode vocal avancé de ChatGPT
Prêt à reposer vos doigts et à faire travailler vos cordes vocales ? Voici comment commencer à discuter avec la dernière création d’OpenAI. Le mode vocal avancé de ChatGPT est actuellement disponible pour un nombre limité de Utilisateurs de ChatGPT Plus (donc tous les membres Plus n’y ont pas accès)mais seulement si vous êtes parmi eux :
- Mettez à jour votre application:Tout d’abord, assurez-vous que vous utilisez la dernière version de l’application ChatGPT. Pour les utilisateurs d’Android, il s’agit de la version 1.2024.206 ou supérieure. Pour les utilisateurs d’iOS, vous aurez besoin de la version 1.2024.205 ou supérieure et votre appareil doit exécuter iOS 16.4 ou supérieur. Aucune technologie ancienne n’est autorisée à cette fête futuriste !
- Trouvez votre voix:Une fois que tout est mis à jour, recherchez l’icône vocale qui se cache dans le coin inférieur droit de votre écran. Appuyez dessus et vous êtes prêt à partir.
- Choisissez votre combattant:Vous aurez le choix entre le mode vocal standard et le tout nouveau mode vocal avancé. Choisissez « Avancé » pour découvrir toute la puissance du GPT-4o.
- Parlez haut et fort: Votre microphone doit être activé par défaut, mais si vous êtes en mode silencieux, vérifiez l’icône du microphone en bas à gauche de l’écran. Appuyez pour changer si nécessaire.
- Discuter:Commencez à parler à votre ami IA aussi naturellement que vous parleriez à un ami humain. N’oubliez pas qu’il peut comprendre vos émotions, alors n’hésitez pas à laisser transparaître votre personnalité.
- Envelopper:Lorsque vous avez terminé d’influencer (ou d’être influencé par) votre nouveau locuteur IA, appuyez sur l’icône rouge en bas à droite pour mettre fin à la conversation.
Conseil de pro:Pour une expérience optimale, utilisez des écouteurs. Et pour les utilisateurs d’iPhone, activez Isolation de la voix mode micro pour éviter toute interruption indésirable. Après tout, trois personnes suffisent pour avoir une conversation à cœur ouvert avec votre assistant IA !
N’oubliez pas que cette fonctionnalité est encore en phase alpha, elle peut donc comporter quelques particularités. Mais bon, même les humains ne sont pas des interlocuteurs parfaits à 100 % du temps, n’est-ce pas ?
Scarlett Johansson : une voix controversée
Alors qu’OpenAI se vante des capacités avancées de sa nouvelle fonctionnalité vocale ChatGPT Advanced Voice Mode, le chemin vers sa sortie n’a pas été sans embûches. Vous vous souvenez de la démo époustouflante de mai ? Il s’avère que l’une des voix, Sky, ressemble étrangement à une Star hollywoodienne.
Scarlett Johansson, également connue pour son rôle d’assistante IA dans le film « Her », aurait refusé plusieurs fois les demandes du PDG d’OpenAI, Sam Altman, d’utiliser sa voix. Johansson a été plus rapide à défendre ce que l’on pourrait appeler « l’intelligence artificielle » lorsqu’une démo mettant en vedette une voix qui ressemblait étrangement à la sienne a été publiée. OpenAI a nié avoir utilisé sa voix mais a immédiatement retiré l’échantillon controversé de son programme.
La sécurité avant les starlettes
En réponse à la controverse, OpenAI a mis un frein à la sortie, prenant le temps d’augmenter les mesures de sécurité. La société affirme avoir testé GPT-4o avec plus de 100 membres externes de l’équipe rouge parlant 45 langues différentes. Le résultat. Un système plus sécurisé avec quatre voix prédéfinies – Juniper, Breeze, Cove et Ember – a été créé en collaboration avec des comédiens rémunérés.
Lindsay McCallum, porte-parole d’OpenAI, assure que ChatGPT « ne peut pas imiter la voix des autres, qu’il s’agisse d’individus ou de personnalités publiques, et bloquera les sorties qui diffèrent de l’une de ces voix prédéfinies ». Donc, si vous espériez discuter avec une Scarlett Johansson virtuelle, vous n’avez pas de chance.
Alors qu’OpenAI déploie progressivement le mode vocal avancé de ChatGPT tous les Plus utilisateurs cet automnele monde de la technologie observe avec impatience. S’agira-t-il de l’IA conversationnelle que nous attendons tous, ou ouvrira-t-elle une nouvelle boîte de Pandore dans le débat en cours sur l’éthique de l’IA et les questions de droits d’auteur ?
Crédits de l’image en vedette : X / OpenAI Modifier: Furkan Demirkaya
Source: Mode vocal avancé de ChatGPT : fait oublier la voix à Scarlett