L’équipe Qwen a annoncé la sortie de CODER QWEN3-480B et CODER QWEN3-CODER-35Bmarquant une progression importante dans les modèles de code agentique ouvert. Ces nouveaux modèles sont conçus pour améliorer considérablement les capacités de codage, offrant une conception architecturale robuste et une utilité pratique pour les tâches de développement logiciel.
QWEN3-CODER-480B est le plus grand modèle de code ouvert à ce jour, démontrant les performances de pointe (SOTA) à travers divers repères de code. Ses capacités englobent l’achèvement du code, l’édition et la génération. Une réalisation notable pour QWEN3-CODER-480B est ses performances exceptionnelles dans l’achèvement du code, en particulier dans la tâche de remplissage du milieu (FIM), où elle a atteint un score de PASS @ 1 de 42,0%. Le vaste régime de formation du modèle impliquait plus de 3 billions de jetons provenant de divers ensembles de données, ce qui contribue à sa capacité améliorée à comprendre et à générer efficacement le code. Ces vastes données de formation et la taille de la taille du modèle la positionnent comme un outil très polyvalent pour les développeurs, capable de gérer un large éventail de tâches, de l’achèvement du code fondamental à la génération de code complexe.
Complétant le modèle 480b, l’instruction du coder QWEN3-35B est spécifiquement optimisée pour fonctionner comme agent de codage, fournissant une assistance aux développeurs ayant des exigences de codage complexes. Ce modèle intègre des fonctionnalités avancées, y compris une fenêtre de contexte de jeton 32K. Il a été formé avec des techniques spécialisées qui facilitent l’utilisation transparente d’outils externes et d’appels de fonction. Cette fonctionnalité permet aux développeurs d’invoquer des API externes directement dans leur environnement de codage, améliorant ainsi la productivité et rationaliser les workflows de développement. Le modèle d’instruction QWEN3-CODER-35B est conçu pour la robustesse et l’efficacité, ce qui le rend très adapté aux applications d’agent qui impliquent des interactions complexes.
Le CODER-480B QWEN3-480B et l’instruction QWEN3-CODER-35B sont désormais accessibles au public sur des plates-formes de tête telles que Hugging Face et Modelscope. Dans une décision de favoriser l’innovation et la collaboration au sein de la communauté de développement de logiciels dirigée par l’IA, l’équipe QWEN a un code, un modèle de modèle et une documentation complets à open source. Cette approche open source vise à permettre aux chercheurs et aux développeurs d’utiliser ces modèles, contribuant à leur amélioration et à leur adoption plus large.
Source: Le nouveau modèle 480b Qwen brise les enregistrements open source





