Le Llama 3.1 405b de Meta AI est un succès qui a réussi à impressionner de nombreux utilisateurs. Le nouveau modèle n’est pas une mince affaire : c’est un gros poisson dans un bassin toujours plus grand de modèles linguistiques. Jetons un œil à l’IA qui fait parler et écrire tout le monde.
Le modèle Llama 3.1 405b de Meta AI est, comme son nom l’indique, un modèle de langage volumineux avec 405 milliards de paramètres. Il fait partie de la série Llama 3 de Meta, lancée en avril 2024. Les premiers tests de référence suggèrent que ce modèle pourrait surpasser les leaders actuels dans plusieurs tests d’IA clés.
Un cheval d’une couleur différente : spécifications du Llama 3.1 405b de Meta AI
Meta AI, anciennement connu sous le nom de Facebook AI Research, est la division de recherche en intelligence artificielle de Meta Platforms. Ils ont lancé Llama (Large Language Model Meta AI) en 2023 comme une alternative open source aux modèles de langage propriétaires. Llama a rapidement gagné en popularité dans la communauté de l’IA. Fort de ce succès, Meta a publié Llama 2 en 2023, qui a montré des améliorations significatives.
Aujourd’hui, avec Llama 3, Meta repousse encore plus loin les limites, aboutissant au puissant modèle Llama 3.1 405b dont nous parlons aujourd’hui. Cette progression rapide illustre l’engagement de Meta à faire progresser la technologie de l’IA open source.
À l’ère de l’intelligence artificielle, les entreprises ne s’arrêtent pas. À une époque où nous regardons les anciens graphismes de jeux et nous nous demandons ce qui peut encore être amélioré, nous en sommes venus à pardonner les nouveaux graphismes, et il en va de même pour l’intelligence artificielle.
Meta AI n’est pas en reste en matière de performances. Ce modèle compte 405 milliards de paramètres, ce qui en fait un acteur de poids dans le domaine de l’IA. Alors, que signifie ce paramètre 405b ?
Ne jamais dire jamais : Llama 3.1 405b de Meta AI contre ses concurrents
Llama 3.1 405b de Meta AI montre des résultats impressionnants dans les premiers tests de performance. Il surpasse GPT-4 dans plusieurs tests, notamment GSM8K, Hellaswag, Boolq et diverses catégories MMLU. Cependant, il est à la traîne dans des domaines comme HumanEval et les sciences sociales MMLU.
Les performances du modèle sont particulièrement bonnes dans les tâches de mathématiques et de codage. Par exemple, dans le test GSM8K, le modèle Llama 3.1 405b de Meta AI a obtenu un score de 96,8, tandis que son homologue 70B a obtenu un score de 94,8. Dans HumanEval, le modèle 405B a atteint 85,3, contre 79,3 pour la version 70B.
Ces chiffres sont basés sur le modèle de base. Le réglage des instructions pourrait potentiellement améliorer encore ces résultats. Nous pouvons donc dire que ces chiffres représentent la puissance de traitement, plus le chiffre est grand, mieux c’est (mais parfois), mais parfois les modèles sont écrasés sous leur charge.
En route vers le futur : Llama 3.1 405b de Meta AI et l’IA open source
Le fait que le modèle Llama 3.1 405b de Meta AI soit une IA open source et que pour la première fois, un modèle open source puisse battre le meilleur LLM à source fermée disponible dans divers benchmarks, peut être un signe avant-coureur de ce qui va arriver, même si ce n’est pas encore totalement compris. Pour l’instant, nous pouvons créer nos GPT dans ChatGPT. Cette dépendance pourrait être rompue à l’avenir.
Llama 3.1 405b de Meta AI est un nouvel acteur de poids dans le domaine de l’IA. Ses excellentes performances sur divers benchmarks et sa nature open source en font un modèle à surveiller. Alors que l’IA continue d’évoluer, Llama 3.1 405b de Meta AI peut jouer un rôle important dans l’élaboration de l’avenir des modèles linguistiques et de la technologie de l’IA.
Crédits de l’image en vedette : Blog sur la méta-IA
Source: Le Llama 3.1 405b de Meta AI se précipite dans les tests de performance