Le 10 mai 2024, Sam Altman, co-fondateur et PDG d’OpenAI, a annoncé la prochaine mise à jour de printemps d’OpenAI sur X.
Alors que les rumeurs circulaient sur GPT-5 ou sur un moteur de recherche, Altman a fait allusion à de « nouvelles choses » qui ressembleraient « à de la magie ».
Du GPT-4o à l’application de bureau ChatGPT, voici tout ce qui a été annoncé lors de la mise à jour OpenAI Spring. Attachez votre ceinture !
GPT-4o était le gros problème de l’émission OpenAI Spring Update
OpenAI a dévoilé sa dernière avancée vers le très populaire ChatGPT, GPT-4o, décrit par la CTO Mira Murati comme son « nouveau modèle phare ».
Cette itération s’appuie sur les capacités de GPT-4, notamment sa capacité à raisonner à travers la voix, le texte et la vision.
Murati a souligné son engagement en faveur de l’accessibilité, dans le but de proposer gratuitement des outils d’IA avancés. Cela correspond à leur mission de démocratiser l’accès à des modèles linguistiques puissants.
Un autre employé d’OpenAI, William Fedus, déclare : « GPT-4o est notre nouveau modèle frontière de pointe. Nous avons testé une version sur l’arène LMSys sous le nom “im-also-a-good-gpt2-chatbot”, avec les résultats de référence suivants sur le nouveau GPT-4o Arène LMSys sur X :
Mais l’ELO peut finalement être limité par la difficulté des invites (c’est-à-dire qu’il ne peut pas atteindre des taux de victoire arbitrairement élevés à l’invite : « quoi de neuf »). Nous constatons que sur les ensembles d’invites plus difficiles – et en particulier le codage – il existe un écart encore plus grand : GPT-4o atteint un ELO de +100 par rapport à notre précédent… pic.twitter.com/ReJzcQdgC8
– William Fedus (@LiamFedus) 13 mai 2024
Avec l’introduction de GPT-4o dans l’API OpenAI, OpenAI démontre son engagement à favoriser l’innovation et à responsabiliser les développeurs.
L’avenir offre des possibilités passionnantes à mesure que les fonctionnalités audio et vidéo deviennent plus largement disponibles, élargissant encore le potentiel d’applications révolutionnaires.
Les utilisateurs bénéficieront davantage de la version gratuite de ChatGPT
Auparavant limité aux appareils mobiles, le mode vocal ChatGPT est désormais disponible sur les ordinateurs de bureau via une application Mac dédiée – et non un assistant vocal comme certains le spéculaient. Cela met en évidence un changement dans la manière dont les humains et les machines collaborent, selon Murati. Elle a expliqué que GPT-4o traite les informations selon diverses modalités, ce qui leur permet d’étendre l’intelligence de niveau GPT-4 aux utilisateurs gratuits, une fonctionnalité sur laquelle ils travaillent depuis des mois.
Plus de 100 millions d’utilisateurs comptent sur ChatGPTet l’efficacité améliorée des ressources de GPT-4o permet OpenAI pour proposer des chatbots personnalisablesGPT personnalisés, dans le niveau gratuit. Les utilisateurs pourront bientôt s’attendre à des outils pour les données, le codage et l’analyse d’images, éliminant ainsi le besoin d’un abonnement payant pour les tâches visuelles de base.
Ces fonctionnalités seront déployées dans les semaines à venir.
Les améliorations significatives apportées au niveau gratuit soulèvent des questions sur la proposition de valeur de l’abonnement mensuel ChatGPT Plus de 20 $. Murati précise que le principal bénéfice reste le possibilité d’effectuer cinq fois plus de requêtes quotidiennes vers GPT-4o par rapport au forfait gratuit.
Lors de l’utilisation de GPT-4o, les utilisateurs de ChatGPT Free auront désormais accès à des fonctionnalités telles que :
- Découvrez l’intelligence de niveau GPT-4
- Obtenez des réponses du modèle et du Web
- Analyser les données et créer des graphiques
- Discutez des photos que vous prenez
- Téléchargez des fichiers pour obtenir de l’aide pour résumer, rédiger ou analyser
- Découvrez et utilisez les GPT et le GPT Store
- Créez une expérience plus utile avec Memory
Chat vocal en temps réel avec ChatGPT
GPT-4o traite directement les entrées audio, éliminant ainsi le besoin de transcription de texte. Lors de la démonstration lors de l’OpenAI Spring Update, un membre du personnel d’OpenAI a simulé des exercices de respiration et GPT-4o a fourni avec succès des suggestions pour améliorer la technique, améliorer le chant et a même offert des conseils pour améliorer l’humeur.
D’autres innovations viennent avec la capacité de GPT-4o à offrir une assistance en temps réel via la diffusion en direct. Cela met en valeur le potentiel de la plateforme en matière de résolution interactive de problèmes et d’éducation. Imaginez des étudiants ou des chercheurs présentant des équations complexes lors d’une diffusion en direct, et ChatGPT fournissant instantanément des explications et des solutions – une approche révolutionnaire de l’apprentissage.
Découvrez comment Greg Brockman présente cette fonctionnalité dans la vidéo ci-dessous.
Présentation de GPT-4o, notre nouveau modèle capable de raisonner sur du texte, de l’audio et de la vidéo en temps réel.
Il est extrêmement polyvalent, amusant à jouer et constitue un pas vers une forme beaucoup plus naturelle d’interaction homme-machine (et même d’interaction homme-machine-machine) : pic.twitter.com/VLG7TJ1JQx
-Greg Brockman (@gdb) 13 mai 2024
L’application de bureau ChatGPT arrive
L’application de bureau Mac présente une interface vocale remarquablement naturelle pour ChatGPT. Lors de la présentation d’OpenAI Spring Update, nous avons vu qu’il peut observer le code en cours d’écriture en temps réel, l’analyser et articuler ses observations, y compris les problèmes potentiels. Les fonctionnalités de vision semblent s’étendre au-delà du code, comme le démontre la capacité de l’application à examiner et à offrir des informations sur un graphique affiché.
ChatGPT comme traducteur en temps réel
Et enfin, lors de l’OpenAI Spring Update, l’équipe OpenAI a présenté ChatGPT Voice comme outil de traduction en direct.
Les phrases prononcées en italien par Murati ont été parfaitement traduites en anglais, avec des réponses retraduites de l’anglais vers l’italien et Tom Warren a capturé les moments sur X :
OpenAI vient de présenter son nouveau modèle GPT-4o effectuant des traductions en temps réel pic.twitter.com/Cl0gp9v3kN
-Tom Warren (@tomwarren) 13 mai 2024
Ces mises à jour représentent une avancée significative pour OpenAI et le domaine des grands modèles de langage. En mettant l’accent sur l’accessibilité, les fonctionnalités améliorées et les capacités en temps réel, OpenAI se positionne à la pointe de la technologie de traitement du langage. Les implications de ces progrès sont vastes et pourraient révolutionner la communication, l’éducation et les efforts créatifs.
En savoir plus sur le GPT-4o dans le article de blog de l’équipe OpenAI ici.
Crédit image en vedette: OpenAI
Source: Tout annoncé lors de la mise à jour OpenAI Spring