Anthropic lên kế hoạch mở rộng AI Claude Mythos sau các bài kiểm tra an ninh mạng

Hãng Anthropic cho biết hôm thứ Năm hãng kỳ vọng sẽ mở rộng quyền truy cập đối với mô hình AI Claude Mythos “trong vài tuần tới” sau khi hoàn tất việc thử nghiệm thêm các biện pháp bảo vệ. Hãng đưa ra tuyên bố này cùng với việc phát hành mô hình Opus 4.8 mới, đánh dấu dấu hiệu rõ ràng nhất cho đến nay về khả năng hệ thống tập trung vào an ninh mạng được phổ biến rộng hơn. Anthropic đã hạn chế quyền truy cập Mythos thông qua Project Glasswing từ tháng Ba, sau các cảnh báo từ các nhà nghiên cứu và cơ quan chính phủ về năng lực tấn công mạng tự động của mô hình. Thông báo được đưa ra trong bối cảnh tranh luận rộng hơn trong ngành AI về cách phát hành các hệ thống tiên tiến có khả năng an ninh tấn công cho khách hàng.

Các hạn chế truy cập hiện tại

Anthropic đã giới hạn việc phân phối Claude Mythos thông qua Project Glasswing, một chương trình cấp quyền truy cập cho một số công ty công nghệ, nhà nghiên cứu bảo mật và đối tác chính phủ trong điều kiện được kiểm soát. Hãng lần đầu mô tả Mythos trong tài liệu blog bị rò rỉ vào tháng Ba, gọi đó là “mô hình AI mạnh mẽ nhất mà chúng tôi từng phát triển”, và định vị nó cao hơn các mô hình Opus của mình. Anthropic cho biết mô hình này “báo trước một làn sóng mô hình sắp tới có thể khai thác lỗ hổng theo cách vượt xa nỗ lực của bên phòng thủ”. Hãng không nêu rõ những biện pháp bảo vệ nào vẫn chưa hoàn thiện trước khi phát hành rộng hơn, hoặc liệu tất cả khách hàng có nhận được mức truy cập giống nhau hay không. Anthropic không phản hồi các yêu cầu bình luận về chi tiết triển khai.

Năng lực kỹ thuật đã được ghi nhận

Viện An ninh AI của Vương quốc Anh phát hiện Mythos đã tự động hoàn thành một cuộc tấn công mô phỏng mạng doanh nghiệp theo 32 bước trong quá trình thử nghiệm. Tháng Tư, Mozilla báo cáo Mythos đã xác định 271 lỗ hổng trong Firefox trong các đánh giá bảo mật nội bộ. Đầu tháng này, công ty khởi nghiệp bảo mật Calif cho biết phiên bản xem trước đã giúp các nhà nghiên cứu phát triển một chuỗi khai thác nhắm vào chip Mac M5 của Apple. Anthropic lập luận rằng Mythos có thể giúp bên phòng thủ nhận diện và vá lỗi phần mềm trước khi kẻ tấn công khai thác chúng. Các nhà nghiên cứu bảo mật và cơ quan chính phủ cũng cảnh báo rằng các năng lực tương tự có thể làm gia tăng tốc độ các cuộc tấn công mạng.

Tranh luận trong ngành về chiến lược phát hành

Mô hình đã trở thành trọng tâm của các cuộc thảo luận trong ngành AI về việc phát hành các hệ thống tiên tiến. Trong một cuộc phỏng vấn tháng Năm với podcast “Core Memory”, CEO OpenAI Sam Altman cáo buộc Anthropic sử dụng “tiếp thị dựa trên nỗi sợ”, lập luận rằng các cảnh báo về rủi ro an ninh mạng có thể được dùng để biện minh cho việc giới hạn quyền truy cập vào các hệ thống AI mạnh mẽ. Người dùng trên Myriad—một nền tảng thị trường dự đoán do công ty mẹ của Decrypt là Dastan vận hành—đã đặt xác suất 44% cho kịch bản Mythos ra mắt trước cuối tháng Sáu tính đến hết thứ Năm, tăng từ mức 17,5% vào sáng cùng ngày.

Các bước tiếp theo đã được xác nhận

Anthropic cho biết họ “đang tiến triển nhanh chóng trong việc phát triển các biện pháp bảo vệ này” và kỳ vọng sẽ đưa “các mô hình thuộc lớp Mythos đến tất cả khách hàng của chúng tôi trong vài tuần tới”.

Câu hỏi thường gặp

Project Glasswing là gì? Project Glasswing là chương trình truy cập bị hạn chế của Anthropic, cung cấp quyền truy cập được kiểm soát tới mô hình Claude Mythos cho một số công ty công nghệ, nhà nghiên cứu bảo mật và đối tác chính phủ theo các điều kiện cụ thể.

Mythos đã xác định được những lỗ hổng nào trong thử nghiệm? Mozilla báo cáo Mythos xác định 271 lỗ hổng trong Firefox trong các đánh giá bảo mật nội bộ vào tháng Tư. Viện An ninh AI của Vương quốc Anh ghi nhận mô hình đã tự động hoàn thành một cuộc tấn công mô phỏng mạng doanh nghiệp gồm 32 bước. Công ty khởi nghiệp bảo mật Calif cho biết phiên bản xem trước đã giúp phát triển một chuỗi khai thác nhắm vào chip Mac M5 của Apple.

Anthropic đã lần đầu công bố Mythos khi nào? Claude Mythos lần đầu xuất hiện vào tháng Ba sau khi các tài liệu blog nháp của Anthropic bị rò rỉ công khai. Hãng mô tả đó là “mô hình AI mạnh mẽ nhất mà chúng tôi từng phát triển” và định vị nó như một tầng mới cao hơn các mô hình Opus.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận