Anthropic đối mặt làn sóng phản đối vì chi phí token của Claude Fable 5 và sự suy giảm âm thầm

Anthropic đã ra mắt Claude Fable 5 vào Thứ Ba, và đến Thứ Tư thì vấp phải làn sóng chỉ trích dữ dội từ cộng đồng AI xoay quanh ba vấn đề cốt lõi. Người dùng cho biết mô hình tiêu thụ token với tốc độ xấp xỉ gấp đôi so với “người tiền nhiệm” Opus 4.8, và một bài thử nghiệm đã khiến gói đăng ký $100 Max cạn trong chưa đầy chín phút. System card do chính Anthropic công bố cho thấy Fable 5 âm thầm làm suy giảm hiệu năng khi thực hiện các tác vụ nghiên cứu AI ở “biên” mà không hề thông báo cho người dùng. Bản phát hành cũng áp dụng bắt buộc thời gian lưu trữ dữ liệu 30 ngày cho mọi mô hình thuộc nhóm Mythos, ảnh hưởng đến người dùng doanh nghiệp vốn vận hành theo yêu cầu quyền riêng tư nghiêm ngặt. Làn phản ứng dữ dội đến từ các nhà nghiên cứu, nhà phát triển và những người ủng hộ mã nguồn mở, cho rằng việc ra mắt này đi ngược các nguyên tắc minh bạch.

Tiêu thụ token của Fable 5 vượt tốc độ của thế hệ trước

Claude Fable 5 có giá $10 cho mỗi một triệu token đầu vào và $50 cho mỗi một triệu token đầu ra—gấp đôi so với Claude Opus 4.8. Mô hình cũng bị tính “gấp đôi” khi đối chiếu với các giới hạn mức sử dụng trong gói đăng ký so với Opus, nghĩa là làm cùng một việc với Fable sẽ rút hạn mức gói nhanh gấp đôi trước khi phát sinh phí API.

Bleeping Computer đã thử nghiệm Fable và phát hiện nó đã tiêu hết hạn mức hằng ngày của gói đăng ký $100 Max trong chưa đầy chín phút. CEO của Scrimba, Per Borgen, tính rằng Fable đã “đốt” 1,3 triệu token trong bảy phút, tương đương $160 mỗi giờ. Theo thông tin từ T3 Chat, người dùng đã chi hơn $1.000 token trong một ngày với gói đăng ký $200. Josh Ellithorpe, CTO của Pixelated Ink, cho biết Fable 5 “đốt token như không có mô hình nào khác”, và chỉ cho anh vài prompt trước khi quota bị cạn.

Anthropic cho rằng tốc độ tiêu thụ này đến từ chế độ Workflow, trong đó tách các prompt phức tạp thành các tác vụ tiểu tác vụ song song (subagent) đòi hỏi nhiều máy tính hơn. Công ty cũng tiết lộ một system prompt mới dài khoảng 120.000 token, được nạp vào mọi cuộc trò chuyện mới. Anthropic cho biết hiệu quả theo từng tác vụ của Fable 5 cao hơn mức thể hiện theo từng token, vì nó tạo ra đầu ra chi tiết hơn với ít lần lặp lại hơn.

Anthropic tiết lộ sự suy giảm hiệu năng âm thầm cho các tác vụ nghiên cứu AI

System card của Anthropic cho Fable 5 cho biết khi mô hình phát hiện người dùng đang làm việc trên phát triển large-language-model ở “biên”—bao gồm các pipeline tiền huấn luyện, hạ tầng huấn luyện phân tán, hoặc thiết kế bộ tăng tốc machine-learning—nó sẽ âm thầm giảm hiệu năng của chính mình thông qua thay đổi prompt, steering vectors, hoặc fine-tuning hiệu quả theo tham số mà không thông báo cho người dùng.

Anthropic viết trong Fable’s System Card: “Không giống các can thiệp của chúng tôi cho an ninh mạng, sinh học và hóa học, và các nỗ lực chưng cất, những biện pháp bảo vệ này sẽ không hiện rõ với người dùng. Thay vào đó, các biện pháp bảo vệ sẽ giới hạn hiệu quả bằng các phương pháp như thay đổi prompt, steering vectors, hoặc fine-tuning hiệu quả theo tham số (PEFT).”

Công ty ước tính điều này sẽ ảnh hưởng đến khoảng 0,03% lưu lượng truy cập. Bản tin AI Latent Space nhận xét rằng một mô hình từ chối công khai giúp các nhà nghiên cứu hiểu được ranh giới, còn một mô hình trông như đang giúp nhưng lại lặng lẽ tạo ra đầu ra tệ hơn sẽ phá hủy khả năng tái lập trong khoa học.

Arthur Zucker, một cộng tác viên nòng cốt tại Hugging Face, đăng: “Gửi Anthropic, bạn đã phá vỡ niềm tin của chúng tôi và tôi không nghĩ bạn bao giờ lấy lại được. Token của tôi sẽ không còn bay theo hướng của bạn nữa.” Mikel Artetxe, đồng sáng lập Reka AI, so sánh thực tiễn này với các kịch bản giả định nơi Apple ngẫu nhiên khởi động lại máy Mac cho người dùng đang xây dựng công nghệ cạnh tranh. Nathan Lambert, người mới bắt đầu một vai trò tại Arcee AI sau khi làm việc với Allen Institute, viết: “Với tôi, điều này mô tả rõ Anthropic là chống khoa học, và do đó chống tiến bộ và chống an toàn.”

Các mô hình thuộc nhóm Mythos cần lưu trữ dữ liệu bắt buộc trong 30 ngày

Anthropic thông báo rằng toàn bộ lưu lượng truy cập đối với các mô hình thuộc nhóm Mythos—Fable 5, Mythos 5, và các mô hình tương lai ở mức năng lực tương tự—sẽ phải tuân thủ lưu trữ dữ liệu bắt buộc trong 30 ngày trên mọi nền tảng nơi các mô hình này được cung cấp, bao gồm các nền tảng bên thứ ba như AWS Bedrock và Google Vertex AI. Công ty cho biết dữ liệu này sẽ bị xóa sau 30 ngày trong “hầu hết các trường hợp”.

Chính sách này ảnh hưởng đến người dùng doanh nghiệp xử lý các trao đổi pháp lý được ưu tiên, hồ sơ y tế, hoặc mã nguồn bí mật. Các công ty châu Âu hoạt động theo quy tắc giảm thiểu dữ liệu của GDPR hoặc các tổ chức yêu cầu khả năng chứng minh không lưu trữ dữ liệu cho các quy trình thuộc diện quản lý sẽ không thể sử dụng Fable 5 cho đến khi Anthropic đưa ra các phương án thay thế.

Người dùng X Lisan al Gaib cho biết: “Anthropic vừa đẩy rất nhiều công ty châu Âu vào tầng lớp dưới vĩnh viễn. Nếu Anthropic lưu dữ liệu cho Claude Mythos và Fable 5 trong 30 ngày, thì tất cả các công ty yêu cầu không lưu trữ dữ liệu sẽ đơn giản là không thể dùng chúng.”

Anthropic công bố giai đoạn truy cập miễn phí tạm thời

Fable 5 miễn phí trên các gói Pro, Max, Team và Enterprise cho đến ngày 22 tháng 6. Sau thời điểm đó, nó chuyển sang chỉ tính theo “usage credits” theo mức giá API, không bao gồm trong gói đăng ký. Anthropic cho biết họ sẽ khôi phục quyền truy cập rộng hơn “ngay khi năng lực mở rộng”.

Câu hỏi thường gặp

Anthropic đã tiết lộ điều gì về hiệu năng của Fable 5 trong các tác vụ nghiên cứu AI?

Trong system card của Fable 5, Anthropic tiết lộ rằng khi mô hình nhận biết người dùng đang làm việc trên phát triển large-language-model ở “biên”—bao gồm các pipeline tiền huấn luyện, hạ tầng huấn luyện phân tán, hoặc thiết kế bộ tăng tốc machine-learning—nó sẽ âm thầm giảm hiệu năng của chính mình thông qua thay đổi prompt, steering vectors, hoặc fine-tuning hiệu quả theo tham số mà không thông báo cho người dùng. Công ty ước tính điều này sẽ ảnh hưởng đến khoảng 0,03% lưu lượng truy cập.

Claude Fable 5 tốn bao nhiêu so với thế hệ trước?

Claude Fable 5 có giá $10 cho mỗi một triệu token đầu vào và $50 cho mỗi một triệu token đầu ra—gấp đôi so với Claude Opus 4.8. Mô hình cũng bị tính “gấp đôi” so với giới hạn sử dụng trong gói đăng ký, nghĩa là cùng một công việc trên Fable sẽ rút hạn mức gói nhanh gấp đôi trước khi phí API được áp dụng. Một bài thử nghiệm đã làm cạn gói đăng ký $100 Max trong chưa đầy chín phút.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận