Theo Beating, Google Gemini 3.1 Flash-Lite đã chuyển từ giai đoạn preview sang khả dụng chung (GA) vào ngày 8/5, trở thành mẫu rẻ nhất và nhanh nhất trong dòng Gemini 3. Giá nhập được đặt ở mức 0,25 USD cho mỗi 1 triệu token và giá xuất ở mức 1,50 USD cho mỗi 1 triệu token—chi phí nhập thấp hơn 75% so với Claude 4.5 Haiku (1,00 USD) và chi phí xuất thấp hơn 70% (5,00 USD). Mô hình có cửa sổ ngữ cảnh 1 triệu token và đạt thông lượng 363 token mỗi giây, nhanh hơn 45% so với Gemini 2.5 Flash.
Các bài benchmark hiệu năng cho thấy GPQA Diamond (lập luận khoa học ở trình độ sau đại học) đạt 86,9%, vượt Claude 4.5 Haiku (73,0%) và GPT-5 mini (82,3%). MMMU-Pro (lập luận đa phương thức) đạt 76,8%. Nhóm người dùng sớm gồm nền tảng dịch vụ khách hàng Gladly, cho biết giảm 60% chi phí và tỷ lệ thành công 99,6% trên các tác vụ chạy thực tế, cùng JetBrains, tích hợp Flash-Lite vào các công cụ hỗ trợ trong IDE.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
OpenAI Chuyển Mô Hình Mặc Định của ChatGPT sang GPT-5.5 Instant, Giảm Ảo Giác tới 52,5%
Theo OpenAI, công ty đã chuyển mô hình mặc định của ChatGPT sang GPT-5.5 Instant vào ngày 8/5. Trong các bài thử nghiệm nội bộ, mô hình tạo ra ít hơn 52,5% các tuyên bố bịa đặt so với GPT-5.3 Instant trong các prompt mang tính rủi ro cao, đồng thời giảm 37,3% các tuyên bố không chính xác trong các cuộc hội thoại được người dùng gắn cờ vì lỗi thực factual er
GateNews2phút trước
Giám đốc điều hành Nvidia, Huang: Hạ tầng AI thế hệ tiếp theo cần nhiều kết nối quang, đồng không đủ vào ngày 8/5
Theo BlockBeats, vào ngày 8 tháng 5, CEO Nvidia Jensen Huang cho biết cơ sở hạ tầng AI thế hệ tiếp theo sẽ cần các kết nối quang rộng rãi vì đồng không đáp ứng được nhu cầu tính toán đang tăng nhanh. Huang khen ngợi quan hệ đối tác mới của Nvidia với Corning, gọi đây là một cơ hội quan trọng
GateNews6phút trước
Cloudflare cho nghỉ việc hơn 1.100 nhân viên (chiếm 20% lực lượng lao động) để chuyển sang vận hành dựa trên AI
Theo Reuters, Cloudflare đã cắt giảm hơn 1.100 nhân viên, tương đương khoảng 20% lực lượng lao động, vào ngày 8 tháng 5 để tái cơ cấu hoạt động xung quanh các công cụ AI. CEO Matthew Prince cho biết công ty đang thiết kế lại mọi nhóm và chức năng để thích ứng với kỷ nguyên AI tác nhân, đồng thời ghi nhận việc sử dụng AI nội bộ.
GateNews20phút trước
Google ra mắt Fitbit Air với giá 99,99 USD, bộ theo dõi không màn hình sẽ trở thành trung tâm Gemini Health Coach vào ngày 26 tháng 5
Theo Beating, Google đã ra mắt Fitbit Air, một thiết bị theo dõi sức khỏe không màn hình được định giá 99,99 USD, dự kiến giao hàng vào ngày 26 tháng 5. Thiết bị chỉ nặng 5,2 gram và có pin 7 ngày, cùng khả năng sạc nhanh trong 5 phút. Các cảm biến theo dõi nhịp tim 24 giờ, phát hiện rung nhĩ, oxy trong máu, h
GateNews22phút trước
OpenAI Phát Hành Ba Mô Hình Giọng Nói trong API Realtime; GPT-Realtime-2 có Cửa Sổ Ngữ Cảnh 128K
Theo Beating, OpenAI đã phát hành ba mô hình giọng nói trong Realtime API của mình: GPT-Realtime-2 cho hội thoại bằng giọng nói có suy luận, GPT-Realtime-Translate cho dịch thuật thời gian thực và GPT-Realtime-Whisper để ghi âm trực tuyến. GPT-Realtime-2 là mô hình giọng nói đầu tiên của OpenAI với mức độ tương đương GPT-5-level re
GateNews38phút trước
Cloudflare gây thất vọng về dự báo lợi nhuận, cắt giảm 1.100 nhân viên, giá cổ phiếu lao dốc 19% sau giờ giao dịch
Báo cáo tài chính quý 1 do Cloudflare công bố vào thứ Năm cho thấy doanh thu và lợi nhuận đều vượt kỳ vọng của thị trường, phản ánh động lực tăng trưởng mạnh mẽ. Tuy nhiên, do công ty dự báo doanh thu quý 2 thấp hơn đôi chút so với ước tính của các nhà phân tích, thị trường đặt câu hỏi liệu đà tăng trưởng này có được duy trì hay không. Đồng thời, Cloudflare công bố sẽ cắt giảm khoảng 1.100 nhân viên, tương đương khoảng 20% tổng lực lượng lao động; CEO Matthew Prince nhấn mạnh AI và các tác nhân (agents) đã trở thành năng suất cốt lõi của công ty, khi mô hình vận hành đang trải qua sự thay đổi căn bản. Trước tác động từ thông tin dự báo tài chính không đạt kỳ vọng và kế hoạch cắt giảm quy mô lớn, giá cổ phiếu của công ty (NET) trong phiên giao dịch sau giờ (after-hours) đã giảm gần 19%.
Cloudflare dự báo gây thất vọng, giá cổ phiếu lao dốc 19% sau giờ
Doanh thu quý 1 của Cloudflare đạt 639,8 triệu USD
ChainNewsAbmedia59phút trước