Anthropic a annoncé lundi le lancement de Claude Sonnet 4.5, un nouveau modèle pionnier qui, selon la société, offre des performances de pointe sur les tests de codage. La société a déclaré que le modèle peut créer des applications « prêtes pour la production », ce qui représente une amélioration de la fiabilité par rapport aux modèles d’IA précédents. Claude Sonnet 4.5 est accessible via l’API Claude et le chatbot Claude, avec une tarification pour les développeurs restant la même que pour Claude Sonnet 4 : 3 $ par million de jetons d’entrée et 15 $ par million de jetons de sortie.

Les modèles d’IA d’Anthropic sont utilisés par les développeurs et les entreprises, et Apple et Meta les utilisent en interne. La société vend également un accès API aux applications de codage d’IA telles que Cursor, Windsurf et Replit. Cette version fait suite à des rapports récents selon lesquels le GPT-5 d’OpenAI a défié les modèles d’Anthropic en les surpassant sur plusieurs tests de codage.

Selon Anthropic, Claude Sonnet 4.5 atteint des performances de pointe sur des benchmarks tels que SWE-Bench Verified. David Hershey, chercheur en IA anthropique, a déclaré que les résultats des tests de référence ne suffisent pas à saisir toutes les capacités du modèle. Hershey a déclaré avoir observé le code du modèle de manière autonome pendant jusqu’à 30 heures lors des premiers essais avec des entreprises clientes. Au cours de ces sessions, l’IA a créé une application, configuré des services de base de données, acheté des noms de domaine et effectué un audit SOC 2. Michael Truell, PDG de Cursor, a décrit Claude Sonnet 4.5 comme ayant « des performances de codage de pointe, en particulier pour les tâches à plus long terme ». Jeff Wang, PDG de Windsurf, a qualifié le modèle de « nouvelle génération de modèles de codage ».

Anthropic affirme également que Claude Sonnet 4.5 est son modèle d’IA frontalier le plus aligné à ce jour, avec des taux de flagornerie et de tromperie inférieurs à ceux de ses prédécesseurs. La société a déclaré avoir amélioré la résistance du modèle aux attaques par injection rapide.