OpenAI a lancé une nouvelle application macOS pour son outil de codage Codex, intégrant des pratiques agentiques qui permettent aux agents d’IA de gérer les tâches de codage de manière indépendante. Cette version suit la tendance du développement de logiciels agentiques, observée dans des outils tels que Claude Code et Cowork, où des nuées d’agents et de sous-agents effectuent une grande partie du travail de programmation.

La société a introduit Codex pour la première fois en tant qu’interface de ligne de commande en avril, suivie d’une interface Web un mois plus tard. L’application macOS, dévoilée lundi, prend en charge l’exécution de plusieurs agents en parallèle. Il intègre les compétences des agents et des flux de travail avancés qui ont gagné en popularité au cours de l’année écoulée.

Le lancement intervient moins de deux mois après la publication par OpenAI du GPT-5.2-Codex, décrit comme son modèle de codage le plus puissant. OpenAI vise par cette combinaison à attirer des utilisateurs de concurrents comme Claude Code.

Le PDG Sam Altman a évoqué les capacités du modèle lors d’un appel à la presse. « Si vous voulez vraiment effectuer un travail sophistiqué sur quelque chose de complexe, le modèle 5.2 est de loin le modèle le plus puissant », a-t-il déclaré. “Cependant, il est plus difficile à utiliser, donc en prenant ce niveau de capacité de modèle et en le plaçant dans une interface plus flexible, nous pensons que cela va avoir beaucoup d’importance.”

Les références de codage présentent une image mitigée. GPT-5.2 occupe la première place sur TerminalBench, qui évalue les performances de l’IA sur les tâches de programmation en ligne de commande. Cependant, les scores de Gemini 3 et de Claude Opus sont inférieurs mais se situent dans la marge d’erreur du benchmark. Sur le banc SWE, qui teste la capacité de l’IA à corriger les bogues logiciels du monde réel, les résultats ne montrent aucun avantage clair pour GPT-5.2.

Les cas d’utilisation des agents restent difficiles à évaluer avec précision. Les expériences des utilisateurs avec des modèles de pointe peuvent varier considérablement.

L’application Codex macOS introduit plusieurs nouvelles fonctionnalités. Il permet aux automatisations en arrière-plan de s’exécuter selon un calendrier, les résultats étant mis en file d’attente pour examen par l’utilisateur au retour. Les utilisateurs peuvent sélectionner des personnalités d’agent allant de pragmatiques à empathiques en fonction de leur style de travail.

Altman a souligné la vitesse de développement de l’application. “Vous pouvez utiliser ceci à partir d’une feuille de papier vierge, toute neuve, pour créer un logiciel vraiment très sophistiqué en quelques heures”, a-t-il déclaré. “Aussi vite que je peux saisir de nouvelles idées, c’est la limite de ce qui peut être construit.”

Crédit image en vedette