Anthropic Xin lỗi vì Claude Fable 5 và 5 cơ chế bảo vệ ẩn, thay thế bằng các cơ chế dự phòng hiển thị cho Opus 4,8 trong tuần này

Theo tài khoản X chính thức của Anthropic ngày 11/6, công ty đã xin lỗi vì đã âm thầm làm giảm chất lượng các phản hồi của Claude Fable 5 đối với những người dùng bị nghi ngờ đang phát triển mô hình AI cạnh tranh, thừa nhận rằng các cơ chế bảo vệ “vô hình” là “lựa chọn đánh đổi sai”. Bắt đầu từ tuần này, các yêu cầu bị gắn cờ sẽ được hạ cấp một cách rõ ràng xuống Claude Opus 4,8 thay vì âm thầm cung cấp đầu ra bị giảm chất lượng. Trên API, người dùng giờ đây sẽ nhận được lý do được nêu rõ khi một yêu cầu bị từ chối, đồng thời các thông báo dự phòng từ phía máy chủ sẽ được triển khai trong vài ngày tới. Anthropic đã thừa nhận sự đánh đổi: việc làm cho các biện pháp bảo vệ trở nên hiển thị sẽ khiến chúng dễ bị vượt qua hơn, đồng nghĩa có thể phát sinh nhiều trường hợp đánh dấu sai hơn đối với các công việc hợp pháp liên quan đến machine learning khi công ty tinh chỉnh hệ thống của mình.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận