Theo CEO Abacus.AI Bindu Reddy, Google dự kiến sẽ ra mắt Gemini 3.2 Flash tại hội nghị I/O vào ngày 20 tháng 5, với hiệu năng đạt 92% so với GPT-5.5 trong các tác vụ lập trình và suy luận, đồng thời cắt giảm chi phí suy luận xuống chỉ bằng một phần mười lăm đến một phần hai mươi so với mô hình còn lại. Phần lớn truy vấn sẽ có độ trễ dưới 200 mili giây. Reddy cho rằng bước đột phá này đến từ kỹ thuật chưng cất và tính thưa của Google, giúp nén một mô hình tiên phong vào hạng Flash mà không gặp “vách ngăn” hiệu năng thường thấy khi tối ưu mô hình.
Related News
Các chuyên gia cho biết các zk-proof mang lại lợi thế cho DePIN khi nhu cầu về niềm tin từ AI ngày càng tăng
Google ra mắt mẫu “AI laptop” đầu tiên: Googlebook tích hợp sâu Gemini, trở thành đối tác cộng tác tốt nhất
Google: Mô hình ngôn ngữ lớn được dùng cho các cuộc tấn công thực tế, AI có thể vượt qua cơ chế bảo mật xác thực hai lớp