De acordo com a CEO da Abacus.AI, Bindu Reddy, o Google planeja divulgar o Gemini 3.2 Flash durante sua conferência I/O em 20 de maio, com desempenho atingindo 92% do GPT-5.5 em tarefas de codificação e raciocínio, enquanto reduz os custos de inferência para apenas um-quinto-te-1/15 e um-vinte-avós do valor do outro. A maioria das consultas terá latência abaixo de 200 milissegundos. Reddy atribuiu o avanço às técnicas de destilação e esparsidade do Google, que comprimem um modelo de ponta na categoria Flash sem a típica queda de desempenho normalmente vista na otimização de modelos.
Related News
Especialistas dizem que provas zk dão uma vantagem aos DePINs à medida que a confiança da IA aumenta
O Google lança seu primeiro “notebook de IA”: integração profunda do Googlebook com o Gemini como melhor parceiro de colaboração
Google: modelos de linguagem de grande porte estão sendo usados para ataques reais, e a IA pode contornar mecanismos de segurança de autenticação em duas etapas