Le Sonnet 4.6 d'Anthropic bat les records du monde SWE-Bench et OS

Anthropic a présenté Sonnet 4.6, une version mise à jour de son modèle Sonnet de taille moyenne. Cette version s’aligne sur le cycle de mise à jour de quatre mois de l’entreprise.

La société a souligné les progrès réalisés dans les capacités de codage, de suivi des instructions et d’utilisation informatique de Sonnet 4.6. Ce modèle servira de modèle par défaut pour les utilisateurs des forfaits Free et Pro d’Anthropic.

Sonnet 4.6, dans sa version bêta, propose une fenêtre contextuelle d’un million de jetons. Cette capacité est le double de la plus grande capacité précédemment disponible pour Sonnet. Anthropic a déclaré que cette fenêtre peut accueillir « des bases de code entières, des contrats longs ou des dizaines de documents de recherche en une seule demande ».

Ce lancement fait suite à l’introduction de l’Opus 4.6 deux semaines auparavant. Un modèle Haiku mis à jour est attendu dans un avenir proche.

Sonnet 4.6 a enregistré de nouveaux scores de référence :

OS World pour une utilisation sur ordinateur
SWE-Bench pour l’ingénierie logicielle
60,4 % sur ARC-AGI-2, une mesure des compétences intellectuelles spécifiques à l’humain

Le score ARC-AGI-2 positionne Sonnet 4,6 au-dessus de la plupart des modèles comparables. Cependant, il se classe en dessous de l’Opus 4.6, du Gemini 3 Deep Think et d’une variante raffinée du GPT 5.2.

Crédit image en vedette

Le Sonnet 4.6 d’Anthropic bat les records du monde SWE-Bench et OS

Related Stories

OpenAI lance l’application de productivité ChatGPT Work optimisée par GPT-5.6

OpenAI lance GPT-5.6 avec Sol, Terra et Luna

Google ajoute des étiquettes de divulgation IA aux annonces dans Search, YouTube et Discover

Anthropic lance le tableau de bord Reflect pour aider les utilisateurs à gérer l’utilisation de Claude