Les grands modèles linguistiques fabriqués en Chine représentent désormais 61 % de la consommation totale de jetons sur OpenRouter, la plus grande plateforme d’agrégation d’API LLM au monde, selon les données hebdomadaires publiées le 24 février 2026. Les trois modèles les plus utilisés sur la plateforme ont tous été développés par des laboratoires d’IA chinois.

MiniMax M2.5 a pris la première place avec 2,45 billions de jetons consommés en une seule semaine, soit une augmentation de 197 % par rapport à la semaine précédente. Kimi K2.5 de Moonshot AI a suivi avec 1,21 billion de jetons, bien que son utilisation ait diminué de 20 % d’une semaine à l’autre. Le GLM-5 de Zhipu AI s’est classé troisième avec 780 milliards de jetons après une hausse de 158 %. DeepSeek V3.2 s’est classé cinquième parmi tous les modèles de la plateforme. Ensemble, les modèles chinois représentaient 5 300 milliards des 8 700 milliards de jetons consommés par les 10 principaux modèles de la plateforme.

L’augmentation de l’utilisation du MiniMax M2.5 est due en partie à un accès promotionnel gratuit. Kilo Code, un outil de codage basé sur l’IA, a proposé le modèle gratuitement pendant une semaine à partir du 12 février. Cline, un autre outil de développement, a organisé une promotion similaire.

MiniMax M2.5 obtient un score de 80,2 % sur SWE-Bench Verified, le plaçant à un point de Claude Opus 4,6 d’Anthropic à 80,8 %.

La programmation est devenue la plus grande catégorie de consommation de jetons sur OpenRouter, passant de 11 % à plus de 50 % du total des jetons jusqu’en 2025. Les flux de travail pilotés par des agents, dans lesquels les modèles exécutent de manière autonome des tâches en plusieurs étapes, représentent désormais plus de la moitié de tous les jetons de sortie sur la plateforme.

Chris Clark, COO d’OpenRouter, a déclaré que les modèles chinois à poids ouvert sont disproportionnellement lourds en flux agents gérés par des entreprises américaines. Les trois modèles chinois les mieux classés cette semaine sont optimisés pour le codage et l’automatisation des agents.

Le coût reste un facteur déterminant. MiniMax M2.5 facture 0,30 $ par million de jetons d’entrée et 1,10 $ par million de jetons de sortie. GLM-5 est au prix de 0,30 $ par million de jetons d’entrée et de 2,55 $ par million de jetons de sortie. À titre de comparaison, Claude Opus 4.6 coûte 5 $ par million de jetons d’entrée et 25 $ par million de jetons de sortie, soit environ 10 à 20 fois plus cher.

La consommation hebdomadaire totale de jetons d’OpenRouter a atteint environ 12 100 milliards, soit une multiplication par 12,7 par rapport à l’année dernière. La plateforme, fondée par l’ancien CTO d’OpenSea Alex Atallah, fournit une passerelle API unifiée vers plus de 400 modèles provenant de plus de 60 fournisseurs.

Martin Casado, partenaire d’Andreessen Horowitz, estime qu’environ 80 % des startups utilisant des piles d’IA open source utilisent des modèles chinois. Le MIT Technology Review a rapporté que l’adoption des modèles chinois à poids ouvert s’accélère dans la Silicon Valley.

Crédit d’image en vedette