DeepSeek V4 et un nouveau modèle Tencent Hunyuan devraient tous deux être lancés en avril 2026, selon Whale Lab.
Ces publications simultanées indiquent une accélération du développement de l’intelligence artificielle (IA) en Chine, l’accent étant mis sur les applications pratiques plutôt que sur les performances de référence.
DeepSeek V4 est décrit comme un grand modèle multimodal capable de générer du texte, des images et des vidéos. Le modèle vise à améliorer les capacités de codage et la mémoire à long terme, un défi connu pour les grands modèles de langage.
Des rapports antérieurs, dont celui du Financial Times, avaient suggéré une version de DeepSeek V4 en mars. Une variante plus légère, « V4 Lite », est apparue sur le site Web de DeepSeek le 9 mars.
Whale Lab a signalé que deux modèles, « Healer Alpha » et « Hunter Alpha », sont apparus sur la plateforme OpenRouter, ce qui suggère qu’il pourrait s’agir des premières versions de DeepSeek V4. Hunter Alpha est décrit comme un modèle comportant des milliards de paramètres avec une fenêtre contextuelle d’un million de jetons. Healer Alpha est présenté comme un modèle multimodal avec un raisonnement multimodal. Aucune entité n’a officiellement revendiqué ces modèles.
DeepSeek a collaboré avec Huawei et Cambricon pour optimiser la V4 pour les puces d’IA chinoises nationales. La société s’est également associée à Baidu pour améliorer ses fonctionnalités de recherche IA.
Le nouveau modèle Hunyuan de Tencent sera dirigé par Shunyu Yao, scientifique en chef de l’IA de Tencent, qui a rejoint Tencent en décembre 2025. Le modèle comporte environ 30 milliards de paramètres et se concentrera sur l’apprentissage en contexte et la convivialité des agents.
Yao, diplômé de l’Université Tsinghua, est connu pour ses travaux sur les frameworks d’agents d’IA tels que ReAct et Tree of Thoughts. Il a plaidé pour un passage de l’analyse comparative aux applications basées sur des scénarios, selon Caixin.
Ces versions font suite à d’autres lancements de modèles d’IA en Chine par des sociétés telles qu’Alibaba et ByteDance. La course au secteur s’intensifie en matière de capacités multimodales, de mémoire à long terme et de performances réelles des agents.








