DeepSeek a annoncé samedi des réductions de prix significatives pour son service API, peu de temps après la sortie de son modèle de grand langage V4 le 24 avril 2023. Le prix réduit les frais d’accès au cache d’entrée à un dixième de leurs frais précédents et offre une réduction de 75 % sur le modèle V4-Pro jusqu’au 5 mai 2023.

Le prix du cache d’entrée du V4-Pro est tombé à 0,025 yuan (environ 0,0036 $) par million de jetons. Les prix standard pendant la période promotionnelle sont fixés à 3 yuans pour l’entrée et à 6 yuans pour la sortie par million de jetons. Cette stratégie de tarification sous-estime considérablement la concurrence, avec des modèles d’Anthropic, OpenAI et Google coûtant entre 12 et 25 dollars par million de jetons, selon les données d’OpenRouter.

DeepSeek a lancé V4-Pro et V4-Flash en avant-première, marquant le premier lancement de modèle significatif de l’entreprise depuis sa version V3.2 en décembre 2022. V4-Pro compte 1,6 billion de paramètres et 49 milliards de paramètres actifs par passe d’inférence, ce qui en fait le plus grand modèle à poids ouvert actuellement disponible. V4-Flash présente une configuration plus petite avec 284 milliards de paramètres.

Même avant les récentes réductions, les prix standard du V4-Pro étaient de 1,74 $ pour l’entrée et de 3,48 $ pour la sortie par million de jetons, soit environ 98 % de moins que le prix du GPT-5.5 Pro d’OpenAI. Les dernières remises élargissent encore cet avantage concurrentiel.

Dans un contexte d’augmentation des coûts de puissance de calcul dans le secteur de l’IA, la stratégie de DeepSeek s’aligne sur une tendance plus large de réduction des prix au sein du secteur. Selon un rapport de Gelonghui, la société a pleinement adopté le concept de « réduction des prix de l’IA ».

Notamment, la V4 fonctionne sur le matériel Huawei Ascend au lieu des puces Nvidia, ce qui, selon les observateurs, pourrait améliorer l’adoption nationale des systèmes d’IA. Wei Sun, analyste principal en IA chez Counterpoint Research, a indiqué que ce développement permet le déploiement de systèmes d’IA sans dépendre uniquement de Nvidia, ce qui pourrait accélérer les progrès nationaux et mondiaux de l’IA.

La V4-Pro fait preuve d’une efficacité significative, ne nécessitant que 27 % de la puissance de calcul de son prédécesseur, la V3.2, pour une fenêtre contextuelle d’un million de jetons. Malgré ses progrès, DeepSeek reconnaît que la V4 reste en retard d’environ trois à six mois sur les modèles leaders tels que GPT-5.4 et Gemini 3.1 Pro, comme indiqué dans le document technique de la société.

Crédit d’image en vedette