O Google Gemini 3.1 Flash-Lite é oficialmente lançado: preço de entrada 75% mais barato que o Claude 4.5 Haiku, pontuação do GPQA 86,9%

De acordo com Beating, o Google Gemini 3.1 Flash-Lite saiu da prévia e entrou em disponibilidade geral (GA) em 8 de maio, tornando-se o modelo mais barato e mais rápido da série Gemini 3. O preço de entrada foi definido em US$ 0,25 por 1 milhão de tokens e o de saída em US$ 1,50 por 1 milhão de tokens — os custos de entrada ficam 75% menores do que o Claude 4.5 Haiku (US$ 1,00) e os de saída ficam 70% menores (US$ 5,00). O modelo tem uma janela de contexto de 1 milhão de tokens e alcança 363 tokens por segundo de throughput, 45% mais rápido do que seu antecessor Gemini 2.5 Flash.

Em benchmarks de desempenho, o GPQA Diamond (raciocínio em ciência no nível de graduação) chega a 86,9%, superando os 73,0% do Claude 4.5 Haiku e os 82,3% do GPT-5 mini. O MMMU-Pro (raciocínio multimodal) atinge 76,8%. Entre os primeiros adotantes estão a plataforma de atendimento ao cliente Gladly, que relata redução de 60% de custos e taxa de sucesso de 99,6% em cargas de trabalho em produção, e a JetBrains, que está integrando o Flash-Lite em ferramentas de assistência dentro do IDE.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.
Comentário
0/400
Sem comentários