Theo giám sát của Beating.AI, một tùy chọn mô hình mới có tên gemini-3.2-flash-lite-live-preview đã xuất hiện trong danh sách chọn mô hình của Google Cloud tính đến ngày 17/5. Các hậu tố “lite” và “live” cho thấy Google đang tạo một phiên bản chuyên biệt được tối ưu cho các tương tác thời gian thực có độ trễ cực thấp.
CEO Abacus.AI Bindu Reddy trước đó đã tiết lộ rằng Gemini 3.2 Flash đạt 92% năng lực lập trình và suy luận của GPT-5.5, đồng thời giữ chi phí suy luận chỉ bằng 1/20 so với GPT-5.5, với đa số truy vấn trả về phản hồi dưới 200 mili giây. Giới quan sát kỳ vọng mô hình nhẹ được tối ưu chi phí này sẽ được Google chính thức công bố tại sự kiện Google I/O vào ngày 20/5.
Related News
Những gương mặt Crypto tiềm năng bứt phá tiếp theo: Các đồng coin có khả năng tăng 1000 lần
X công bố mã nguồn thuật toán gợi ý “For You”: hướng dẫn thực chiến về việc vận hành tài khoản Twitter bằng thuật toán
OpenAI bổ sung tính năng phát hiện hội thoại khủng hoảng trên ChatGPT, nâng cao khả năng cảnh báo bạo lực tự hủy