Z.ai lance le modèle GLM-5.1, surpassant ses concurrents dans les benchmarks

Z.ai, anciennement connu sous le nom de Zhipu AI, a publié mardi le modèle GLM-5.1. Ce modèle phare open source est conçu pour l’ingénierie agentique et peut gérer de manière autonome une seule tâche de codage pendant huit heures maximum, en effectuant la planification, l’exécution, les tests et l’optimisation en boucle continue.

Le modèle GLM-5.1 a obtenu un score de 58,4 sur le benchmark SWE-Bench Pro, surpassant GPT-5.4, Claude Opus 4.6 et Gemini 3.1 Pro. Cette version fait suite à un perfectionnement post-formation du GLM-5, qui a été introduit en février en tant que modèle de mélange d’experts de 744 milliards de paramètres, utilisant environ 40 milliards de paramètres actifs par jeton et entièrement formé sur les puces Huawei Ascend sans matériel Nvidia.

Selon la documentation de Z.ai, GLM-5.1 améliore les capacités de codage et d’agent grâce à des techniques telles que des étapes de réglage fin supervisé multitâches et d’apprentissage par renforcement. Le modèle est capable de supporter une exécution autonome de huit heures, complétant ainsi une boucle complète « expérimentation-analyse-optimisation ». Lors de démonstrations, il a réussi à créer un système de bureau Linux complet à partir de zéro en huit heures, en exécutant 655 itérations et en augmentant de 6,9 fois le débit des requêtes de la base de données vectorielles.

GLM-5.1 dispose d’une fenêtre contextuelle de 200 000 jetons et prend en charge jusqu’à 128 000 jetons de sortie. Il a été optimisé pour les flux de travail de codage agent et est compatible avec des outils comme Claude Code et OpenClaw. Le modèle a atteint une accélération moyenne géométrique de 3,6 fois sur des charges de travail réelles d’apprentissage automatique dans le benchmark d’optimisation KernelBench niveau 3.

GLM-5.1 est disponible pour tous les abonnés au plan de codage GLM, avec ses pondérations publiées sous licence MIT. Z.ai, qui a été introduit à la Bourse de Hong Kong en janvier avec une valorisation de 31,3 milliards de dollars, propose un accès API pour GLM-5.1 au prix de 1,00 $ par million de jetons d’entrée et de 3,20 $ par million de jetons de sortie.

Le lancement intensifie la concurrence dans l’espace des modèles de codage open source, plaçant GLM-5.1 à l’avant-garde du SWE-Bench Pro devant ses homologues fermés. Alors que Z.ai affirme que les capacités du modèle sont alignées sur celles de Claude Opus 4.6, des évaluations indépendantes montrent qu’il atteint environ 94,6 % du score de codage plus large de l’Opus 4.6, ce qui indique certaines lacunes dans les tâches de raisonnement et de création.

Crédit d’image en vedette

Z.ai lance le modèle GLM-5.1, surpassant ses concurrents dans les benchmarks

Related Stories

Meta teste l’application Creator Studio AI avec les créateurs

OpenAI lance la première puce d’IA personnalisée construite avec Broadcom

OpenAI met à niveau GPT-5.5 Instant pour un contexte plus précis et moins d’erreurs

Les étudiants qui comptaient sur l’IA ont obtenu de moins bons résultats aux examens ultérieurs