Anthropic a présenté Sonnet 4.6, une version mise à jour de son modèle Sonnet de taille moyenne. Cette version s’aligne sur le cycle de mise à jour de quatre mois de l’entreprise.

La société a souligné les progrès réalisés dans les capacités de codage, de suivi des instructions et d’utilisation informatique de Sonnet 4.6. Ce modèle servira de modèle par défaut pour les utilisateurs des forfaits Free et Pro d’Anthropic.

Sonnet 4.6, dans sa version bêta, propose une fenêtre contextuelle d’un million de jetons. Cette capacité est le double de la plus grande capacité précédemment disponible pour Sonnet. Anthropic a déclaré que cette fenêtre peut accueillir « des bases de code entières, des contrats longs ou des dizaines de documents de recherche en une seule demande ».

Ce lancement fait suite à l’introduction de l’Opus 4.6 deux semaines auparavant. Un modèle Haiku mis à jour est attendu dans un avenir proche.

Sonnet 4.6 a enregistré de nouveaux scores de référence :

  • OS World pour une utilisation sur ordinateur
  • SWE-Bench pour l’ingénierie logicielle
  • 60,4 % sur ARC-AGI-2, une mesure des compétences intellectuelles spécifiques à l’humain

Le score ARC-AGI-2 positionne Sonnet 4,6 au-dessus de la plupart des modèles comparables. Cependant, il se classe en dessous de l’Opus 4.6, du Gemini 3 Deep Think et d’une variante raffinée du GPT 5.2.

Crédit image en vedette