D’après Beating, Google Gemini 3.1 Flash-Lite est passé de la phase de préversion à la disponibilité générale (GA) le 8 mai, devenant le modèle le moins cher et le plus rapide de la série Gemini 3. Le prix en entrée est fixé à 0,25 $ par million de tokens et en sortie à 1,50 $ par million de tokens — les coûts d’entrée sont 75% moins élevés que ceux de Claude 4.5 Haiku (1,00 $) et la sortie est 70% moins chère (5,00 $). Le modèle dispose d’une fenêtre de contexte de 1 million de tokens et atteint un débit de 363 tokens par seconde, soit 45% plus rapide que son prédécesseur Gemini 2.5 Flash.
Les références de performance affichent GPQA Diamond (raisonnement scientifique au niveau licence/graduate) à 86,9%, dépassant Claude 4.5 Haiku (73,0%) et GPT-5 mini (82,3%). MMMU-Pro (raisonnement multimodal) atteint 76,8%. Les premiers utilisateurs incluent la plateforme de service client Gladly, qui indique une réduction de 60% des coûts et un taux de réussite de 99,6% sur des charges de travail en production, ainsi que JetBrains, qui intègre Flash-Lite dans des outils d’assistance de l’IDE.
Related News