Google lance Gemini 3.1 Flash-Lite, le modèle Gemini le plus rapide et le plus économique

Google a lancé Gemini 3.1 Flash-Lite, son modèle Gemini 3 le plus rapide et le plus abordable à ce jour, au prix de 0,25 $ par million de jetons d’entrée et de 1,50 $ par million de jetons de sortie.

Le modèle cible les charges de travail des développeurs, le traitement des données et les tâches de traduction à volume élevé. Il est disponible en avant-première via l’API Gemini dans Google AI Studio et Vertex AI mais n’est pas inclus dans l’application grand public Gemini.

Comparée à Gemini 2.5 Flash-Lite, la nouvelle version est plus chère mais nettement plus performante. Il surpasse généralement le Gemini 2.5 Flash à un prix inférieur.

Le modèle surpasse ses concurrents, notamment GPT-5 mini et Claude 4.5 Haiku. Grok 4.1 Fast est plus abordable, mais Gemini 3.1 Flash-Lite est plus rapide, promettant jusqu’à 363 jetons par seconde.

Sur les benchmarks multimodaux, le modèle a marqué 1 432 points Elo dans le classement Arena.ai. Cela le place parmi les modèles à poids ouvert et les offres commerciales de dernière génération.

Google n’a pas publié de références d’agents pour cette version. La société a déclaré que le modèle est destiné aux tâches et au traitement de données à volume élevé, et non à la gestion de flottes d’agents.

Les développeurs peuvent utiliser l’API pour ajuster le temps de raisonnement du modèle afin de contrôler les coûts. Des paramètres de raisonnement inférieurs produisent moins de jetons, ce qui est pertinent pour les charges de travail à volume élevé.

Il s’agit de la première version Flash-Lite pour Gemini 3.1. Google lance traditionnellement d’abord des versions Flash plus performantes ou ignore complètement Flash-Lite, comme il l’a fait avec Gemini 3.

Google a lancé Gemini 3.1 Pro deux semaines auparavant. La société décrit Flash-Lite comme étant destiné aux charges de travail de développement à grande échelle et à grand volume.

Crédit image en vedette

Google lance Gemini 3.1 Flash-Lite, le modèle Gemini le plus rapide et le plus économique

Related Stories

OpenAI lance l’application de productivité ChatGPT Work optimisée par GPT-5.6

OpenAI lance GPT-5.6 avec Sol, Terra et Luna

Google ajoute des étiquettes de divulgation IA aux annonces dans Search, YouTube et Discover

Anthropic lance le tableau de bord Reflect pour aider les utilisateurs à gérer l’utilisation de Claude