Un chapitre se termine avec la sortie de GPT-4o mini par OpenAI. Certaines IA sont devenues obsolètes même si elles ne sont sorties que récemment. Ce nouveau modèle remplacera ChatGPT 3.5, largement utilisé et gratuit. GPT-4o mini, plus efficace et économe en énergie que l’ancien modèle, est réputé pour être beaucoup plus intelligent que son prédécesseur. Dans la transition du modèle auquel nous sommes habitués à GPT-4o mini, les utilisateurs peuvent s’attendre à de nouvelles fonctionnalités et GPT4o mini est entièrement gratuit.
Pour bien comprendre l’importance de ce changement, il faut s’intéresser au parcours de ChatGPT 3.5. Lancé en 2022, ChatGPT 3.5 est rapidement devenu un nom familier, captivant les utilisateurs par sa capacité à générer du texte de type humain, à répondre à des questions et à aider à diverses tâches. Il est devenu largement utilisé par les particuliers et les entreprises. Il a même servi d’outil puissant pour la création de contenu, la résolution de problèmes et la recherche d’informations générales. Ces dernières années, cependant, d’autres IA publiées gratuitement ont dépassé ChatGPT 3.5.
Que peut faire le GPT-4o mini ?
Le GPT-4o mini est doté d’un certain nombre d’améliorations qui le distinguent naturellement de son prédécesseur, sinon, il serait illogique. L’une des améliorations les plus notables est la possibilité d’effectuer à la fois le traitement de texte et d’images. Cette nouvelle double capacité permet au modèle de traiter et de comprendre des informations provenant de plusieurs sources, ce qui peut potentiellement donner lieu à des résultats plus complets et plus précis.
Les capacités du modèle ont été testées avec différents tests de performance. Sur le test de performance MMLU (Massive Multitask Language Understanding), qui mesure le raisonnement sur un large éventail de sujets, le GPT-4o mini a obtenu un score de 82 %. Selon ces résultats, le nouveau modèle d’OpenAI surpasse les autres petits modèles d’IA du marché. Nous ferons des tests de performance dans notre propre famille. Et bien sûr, c’est à vous de jouer.
Un autre domaine dans lequel le GPT-4o mini est censé briller est le raisonnement mathématique. Le modèle a obtenu un score impressionnant de 87 % au test de performance MGSM (Mathematics Grade School Merge). Cela signifie que notre nouvel ami peut écrire du code magnifique, résoudre des problèmes de logique ou vous aider à faire des devoirs complexes.
En termes d’applications pratiques, GPT-4o mini prend en charge à la fois le texte et l’image dans son API. Cela signifie que vous pouvez intégrer l’application dans d’autres médias plutôt que de l’utiliser uniquement sur un site Web. OpenAI ne s’arrête pas là, annonçant son intention d’étendre les capacités du modèle pour inclure le traitement vidéo et audio à l’avenir, élargissant ainsi encore ses cas d’utilisation potentiels.
Spécifications du mini GPT-4o
D’un point de vue technique, le mini GPT-4o tente de représenter un équilibre entre performances et efficacité. OpenAI n’a pas révélé la taille exacte du modèle, mais affirme qu’il est comparable à d’autres petits modèles d’IA tels que Llama 3 8b, Claude Haiku et Gemini 1.5 Flash. Je veux dire, qu’est-ce que ce serait d’autre de toute façon ?
L’un des principaux avantages du GPT-4o mini est sa vitesse. Comme vous le savez, dans le modèle ChatGPT 3.5, les réponses prennent parfois jusqu’à 20 secondes, maintenant elles prendront jusqu’à 10 secondes. Selon les premiers tests, le modèle a un débit médian de 202 pièces par seconde. C’est plus de deux fois plus rapide que le GPT-4o et le GPT-3.5 Turbo, ce qui le rend particulièrement adapté aux applications où des temps de réponse rapides sont cruciaux.
La fenêtre contextuelle du modèle est une autre caractéristique technique importante. Le GPT-4o mini peut traiter jusqu’à 128 000 pièces à la fois. Cela équivaut à la longueur d’un livre moyen. Cette grande fenêtre contextuelle permet au modèle de maintenir la cohérence et la pertinence lors de longues interactions ou lors du traitement de longs documents.
Le mini GPT-4o contient des informations et des données jusqu’en octobre 2023. Ces données peuvent être actualisées avec des mises à jour. Mais pour l’instant, vous ne pourrez peut-être pas obtenir de réponses efficaces pour un événement ou un développement après cette date.
C’est trop long ?
- Prend en charge le traitement de texte et d’image
- Score de référence MMLU : 82 %
- Score de référence MGSM : 87 %
- L’API prend en charge la saisie de texte et de vision
- Taille comparable à d’autres petits modèles d’IA (Llama 3 8b, Claude Haiku, Gemini 1.5 Flash)
- Vitesse de sortie moyenne : 202 jetons par seconde
- Fenêtre de contexte : 128 000 jetons
- Date limite de connaissance : octobre 2023
- Temps de réponse jusqu’à 10 secondes
Que pensez-vous du prix mini du GPT-4o ?
Les prix des API n’ont pas encore été annoncés, mais OpenAI a fixé le prix du modèle à 15 centimes par million de jetons d’entrée et 60 centimes par million de jetons de sortie pour les développeurs utilisant ses API. Cette structure de prix rend GPT-4o mini plus abordable que ses prédécesseurs et OpenAI affirme qu’il est 60 % moins cher que GPT-3.5 Turbo.
La réduction des coûts d’exploitation de GPT-4o mini pourrait avoir des répercussions considérables sur l’accessibilité de l’IA. En rendant les capacités avancées d’IA disponibles à un prix inférieur, OpenAI ouvre potentiellement la voie à une adoption plus large de la technologie de l’IA dans une variété de secteurs et de régions.
L’efficacité et le prix abordable du modèle le rendent particulièrement intéressant pour les tâches simples et à volume élevé qui nécessitent des appels répétés au modèle d’IA. Cela pourrait être particulièrement bénéfique pour les petites et moyennes entreprises ou les développeurs travaillant sur des projets avec des budgets limités.
GPT-4o mini par rapport aux autres modèles phares
Pour mieux comprendre le nouveau modèle, faisons une comparaison technique avec d’autres modèles :
Modèle | Précision (%) | MMLU | GPQA | BAISSE | MGSM | MATHÉMATIQUES | Évaluation humaine | MMMU | MathVista |
GPT-4o mini | 82,0 | 40.2 | 79,7 | 87,0 | 70.2 | 87,2 | 59,4 | 56,7 | 63,8 |
Flash Gémeaux | 77,9 | 38,6 | 78,4 | 75,5 | 40,9 | 71,5 | 56.1 | 58,4 | 0,0 |
Claude Haïku | 73,8 | 35,7 | 78,4 | 71,7 | 40,9 | 75,9 | 50.2 | 46.4 | 0,0 |
GPT-3.5 Turbo | 69,8 | 30,8 | 70.2 | 56.3 | 43.1 | 68,0 | 0,0 | 0,0 | 0,0 |
GPT-4o | 88,7 | 53,6 | 83,4 | 90,5 | 76,6 | 90,2 | 69.1 | 0,0 | 0,0 |
GPT-4 | 90,0 | 55,0 | 85,0 | 92,0 | 78,0 | 92,5 | 70,5 | 60,0 | 65,0 |
GPT-4 Turbo | 91,0 | 56,0 | 86,0 | 93,0 | 79,0 | 93,5 | 71,0 | 61,0 | 66,0 |
Gémeaux | 85,0 | 50,0 | 80,0 | 88,0 | 72.0 | 88,5 | 65,0 | 55,0 | 60,0 |
Gémeaux Avancé | 87,0 | 52.0 | 82,0 | 90,0 | 74,0 | 90,0 | 67,0 | 57,0 | 62,0 |
- MMLU (compréhension massive du langage multitâche) : Une référence complète pour évaluer les modèles linguistiques sur un large éventail de tâches dans différents domaines.
- GPQA (Réponses à des questions à usage général) : Une référence pour tester la capacité d’un modèle à répondre avec précision à des questions de connaissances générales.
- DROP (Raisonnement discret sur les paragraphes) : Un critère de référence de compréhension en lecture qui nécessite que les modèles effectuent des opérations discrètes telles que l’addition et la soustraction sur du texte.
- MGSM (Mathématiques en plusieurs étapes) : Une référence pour évaluer la capacité d’un modèle à résoudre des problèmes mathématiques en plusieurs étapes.
- MATHÉMATIQUES: Un benchmark spécifiquement axé sur l’évaluation des capacités de résolution de problèmes mathématiques des modèles linguistiques.
- HumanEval : Une référence pour évaluer la génération de code, où les modèles sont évalués en fonction de leur capacité à générer du code correct et fonctionnel à partir d’énoncés de problèmes.
- MMMU (Compréhension des machines multimodales) : Un critère de référence qui teste la capacité d’un modèle à comprendre et à intégrer des informations provenant de plusieurs modalités, telles que du texte, des images et de l’audio.
- MathVista: Un référentiel spécifique conçu pour évaluer les capacités de raisonnement mathématique et de résolution de problèmes des modèles de langage dans diverses disciplines mathématiques.
En fin de compte, le « meilleur » modèle dépend de vos besoins. Le GPT-4o mini offre un mélange impressionnant de fonctionnalités dans un format plus compact, ce qui en fait un choix attrayant pour de nombreux utilisateurs.
Crédits de l’image en vedette : OpenAI
Source: ChatGPT 3.5 est remplacé par GPT-4o mini