Reflection 70B est une IA qui peut corriger ses propres erreurs

Reflection 70B fait ce que les grands ne peuvent pas faire et apprend de ses propres erreurs. Cette IA dotée de modèles de langage open source a peut-être trouvé une contre-mesure contre les illusions.

Lancé par HyperWrite, une startup dirigée par le cofondateur et PDG Matt Shumer, Reflection 70B est basé sur Llama 3.1-70B Instruct de Meta. Ce qui différencie ce modèle des autres est sa capacité d’autocorrection, une capacité unique qui a attiré l’attention de la communauté de l’IA.

Je suis ravi d’annoncer Reflection 70B, le meilleur modèle open source au monde.

Formé à l’aide de Reflection-Tuning, une technique développée pour permettre aux LLM de corriger leurs propres erreurs.

Le 405B arrive la semaine prochaine – nous pensons qu’il sera le meilleur modèle au monde.

Construit avec/ @GlaiveAI.

Lire la suite : pic.twitter.com/kZPW1plJuo

— Matt Shumer (@mattshumer_) 5 septembre 2024

La caractéristique la plus remarquable de Reflection 70B

Shumer a annoncé l’arrivée de Reflection 70B à X et a souligné sa supériorité sur les autres modèles du marché open source. Il a déclaré avec assurance que l’IA est actuellement le meilleur modèle d’IA open source, surpassant ses prédécesseurs, y compris la série Llama de Meta. Des repères tels que MMLU et Évaluation humaine a également confirmé les hautes performances du Reflection 70B, affichant de meilleurs résultats que les alternatives open source et commerciales.

La raison pour laquelle Reflection 70B obtient ces résultats, et une fonctionnalité qui manque à ses concurrents, est sa capacité à détecter et à corriger les erreurs. Il s’agit d’une fonctionnalité révolutionnaire dans l’IA, car si les modèles linguistiques sont souvent «halluciner” ou produire de fausses informations, l’IA de Shumer peut reconnaître les erreurs avant de fournir une réponse définitive. Shumer réfléchit à ce concept depuis des mois, et avec ce nouveau modèle, c’est désormais une réalité.

Reflection 70B tient tête même aux meilleurs modèles à source fermée (Claude 3.5 Sonnet, GPT-4o).

C’est le meilleur LLM en (au moins) MMLU, MATH, IFEval, GSM8K.

Bat le GPT-4o sur tous les tests de performance.

Il écrase le Llama 3.1 405B. Il n’est même pas proche. pic.twitter.com/win7cHUOob

— Matt Shumer (@mattshumer_) 5 septembre 2024

Le nom de Reflection 70B représente ses capacités d’introspection car il «reflète” son raisonnement pour vérifier l’exactitude du modèle. La conception comprend des icônes spéciales qui améliorent le raisonnement et la correction des erreurs, permettant aux utilisateurs d’interagir plus efficacement avec le modèle. Ces processus de raisonnement peuvent être vus sous la forme d’étiquettes spéciales qui permettent des corrections en temps réel.

Pour démontrer son efficacité, les utilisateurs peuvent interagir avec Reflection 70B sur un site de démonstrationmais il y a des difficultés d’accès au site en raison de circulation denseCertaines tâches, comme déterminer quel nombre est le plus grand entre 9.11 et 9.9sont conçus pour mettre à l’épreuve la précision du modèle. Alors que de nombreux systèmes d’IA ont du mal à répondre à de telles requêtes, Reflection 70B a réussi à les résoudre correctement, malgré des plus de 60 secondesMalgré le retard, ce niveau de raisonnement permet au modèle de se démarquer pour les cas d’utilisation où la précision est essentielle.

Reflection 70B n’est que le début

Le Reflection 70B est le premier modèle d’une série en pleine expansion. Un modèle encore plus grand, le Reflection 405B, sera bientôt commercialisé. La vision ambitieuse de Shumer pour les modèles Reflection comprend le dépassement des capacités des modèles à source fermée tels que le GPT-4 d’OpenAI. Le Reflection 405B surpasserait les meilleurs modèles propriétaires et repousser les limites de ce que l’IA open source peut accomplir.

Mais Reflection 70B n’est pas seulement un projet autonome. Shumer a également annoncé son intention d’intégrer le modèle dans HyperWriteLa plateforme d’aide à la rédaction de Reflection 70B. HyperWrite, une extension Chrome qui aide les utilisateurs à rédiger des e-mails, à résumer du texte et bien plus encore, compte déjà des millions d’utilisateurs. L’intégration prochaine de Reflection 70B dans cette plateforme offrira aux utilisateurs un nouveau niveau de précision et de personnalisation, permettant une saisie encore plus avancée basée sur l’IA.

Un processus de formation rapide et efficace

La formation Reflection 70B n’a pas été un processus long et fastidieux, grâce à un partenariat avec Glaiveune startup spécialisée dans les jeux de données d’IA. La plateforme de Glaive crée des jeux de données spécifiques à chaque cas d’utilisation, ce qui facilite et accélère la formation des modèles linguistiques. Dans le cas de Reflection 70B, cette approche a permis de former le modèle cinq fois en seulement trois semaines, un exploit rendu possible grâce à l’utilisation des systèmes de génération de données synthétiques de Glaive.

Je veux être très clair : @GlaiveAI C’est la raison pour laquelle cela a si bien fonctionné.

Le contrôle qu’ils vous donnent pour générer des données synthétiques est insensé.

Je les utiliserai pour presque tous les modèles que je construirai à l’avenir, et vous devriez faire de même. https://t.co/I789UIa5Yg

— Matt Shumer (@mattshumer_) 5 septembre 2024

Fondée par Sahil Chaudhary, la société a pour objectif de fournir des ensembles de données de haute qualité qui permettent de former des modèles rapidement et à moindre coût. Leur succès dans la formation de modèles plus petits a été démontré par le passé. Un modèle paramétré en 3D a surpassé de nombreux grands concurrents open source sur certaines tâches.

Réflexion 70B en action

Le développement du modèle montre à quel point cela est important pour HyperWrite, qui a été fondée en 2020 sous le nom d’Otherside AI. Basée à l’origine à Long Island, New York, HyperWrite est passée d’un petit assistant d’écriture IA à une plateforme avec plus de deux millions d’utilisateursSon succès précoce a valu à Shumer et à son co-fondateur Jason Kuperberg une tache sur Liste Forbes « 30 Under 30 » en 2023.

En mars 2023, HyperWrite a levé 2,8 millions de dollars dans le financement d’investisseurs comme Groupe Madrona Venturequi a aidé l’entreprise à se développer. De nouvelles fonctionnalités telles que des assistants de navigateur capables d’effectuer des tâches telles que la réservation de vols ou la recherche de candidats à un emploi sur LinkedIn ont permis à HyperWrite de rester à la pointe de l’assistance personnelle basée sur l’IA. intégration Reflection 70B devrait améliorer ces fonctionnalités et consolider davantage la position d’HyperWrite dans l’industrie de l’IA.

Reflection 70B va changer notre façon de penser l’IA. Il combine précision et raisonnement comme aucun autre modèle ne le fait. Le modèle est utile pour les tâches nécessitant une grande précision, mais ses applications potentielles sont beaucoup plus vastes. La sortie prochaine de Reflection 405B montre que Shumer et son équipe travaillent toujours dur. À mesure qu’HyperWrite améliore sa plateforme et crée de nouvelles fonctionnalités, la série Reflection sera probablement très importante. Avec Reflection 70B, il sera intéressant de voir comment la communauté de l’IA et les utilisateurs réagissent aux capacités uniques du modèle et comment les futurs modèles s’appuieront sur ses fondations.

Crédits de l’image en vedette : DC Studio / Freepik

Source: Reflection 70B est une IA qui peut corriger ses propres erreurs