Chuyên gia an ninh mạng: Các mô hình AI nguy hiểm như Claude Mythos hoàn toàn không thể ngăn chặn, trong vòng 24 tháng sẽ tràn lan khắp nơi

Chính phủ của Trump tuần trước dựa trên lý do an ninh quốc gia, đã bắt buộc Anthropic gỡ bỏ hai mô hình mạnh nhất là Claude Fable 5 và Mythos 5, lý do là "có thể bị jailbreak". Tuy nhiên, các chuyên gia an ninh mạng đã phản bác, cho rằng lần kiểm soát này chỉ là của một công ty, một số mô hình; trong vòng 6 đến 24 tháng, khả năng tương đương sẽ được phổ biến rộng rãi từ nhiều nguồn.

(Tiểu sử: Tiêu tiền để tăng trưởng! Tài liệu rò rỉ của OpenAI tiết lộ "lỗ hổng hoạt động 209 tỷ USD", dự kiến đến năm 2030 mới có lợi nhuận)

(Bổ sung bối cảnh: CZ khen Hyperliquid là phát minh tuyệt vời! Nhưng cười rằng không KYC thì quá nguy hiểm: Tôi đã trải qua rồi, họ tốt nhất nên có luật sư siêu mạnh)

Cuối tuần trước, chính phủ Trump dựa trên lý do rủi ro an ninh quốc gia, đã bắt buộc gỡ bỏ hai mô hình mới nhất của Anthropic: Claude Fable 5 và Mythos 5. Lập luận của Nhà Trắng là: Fable 5 mở cho công chúng truy cập, nhưng hàng rào bảo vệ (nói đơn giản là cơ chế an toàn từ chối phản hồi các vấn đề có hại của mô hình) có thể bị tháo bỏ, điều này được coi là rủi ro an ninh quốc gia.

Anthropic vẫn đang đàm phán với Nhà Trắng để đưa ra điều kiện mở lại, hiện chưa rõ khi nào sẽ được mở lại.

Cây dao hai lưỡi này, chính Anthropic cũng biết rõ

Mythos 5 không phải là mô hình ngôn ngữ thông thường. Kể từ khi Anthropic lần đầu ra mắt với tên gọi "Mythos Preview" vào tháng 4, công ty đã cảnh báo về rủi ro của nó đồng thời. Nói đơn giản là, trong tay các nhà nghiên cứu an ninh mạng thì là công cụ phòng thủ, trong tay kẻ ác thì có thể là vũ khí tấn công.

Chính vì vậy, Mythos 5 ban đầu chỉ được phát hành bí mật cho nhóm dự án Project Glasswing và các liên minh chọn lọc; còn Fable 5 mặc dù công khai cho đại chúng, nhưng có các giới hạn đặc biệt về các vấn đề sinh học và an ninh mạng.

6 tháng so với 24 tháng

Dù chính phủ Trump ra lệnh cấm, nhưng trưởng nhóm đội đỏ của Anthropic, Logan Graham, đã nói rõ với WIRED từ tháng 4 khi Mythos Preview ra mắt:

"Thông điệp thực sự là, đây không phải về mô hình này hay Anthropic. Chúng ta phải chuẩn bị cho một thế giới, trong vòng 6, 12, 24 tháng tới, những khả năng này sẽ trở nên phổ biến rộng rãi."

Cố vấn an ninh mạng của công ty TPO Group, Tarah Wheeler, còn nói thẳng hơn:

"Nghĩ rằng không có đối thủ nào khác sẽ phát triển khả năng tương tự Mythos, hoặc thậm chí nghĩ rằng họ chưa làm được, là cực kỳ thiển cận. Có những công ty khác đang theo sát Anthropic, rất có thể cũng đã có những khả năng này, chỉ là đang chờ đợi, quan sát xem Anthropic sẽ bị xử lý thế nào trong môi trường quản lý hiện tại."

Nhà nghiên cứu của Harvard, Bruce Schneier, cũng nói với WIRED: "Đây là xu hướng chung của công nghệ. Các mô hình nhỏ hơn, rẻ hơn, mã nguồn mở, đôi khi độc lập, đôi khi hợp tác với nhau, chỉ cần những gợi ý tinh vi hơn là có thể sánh được với Mythos. Chúng ta nên dự đoán rằng các mô hình khác trong vài tháng tới sẽ có thể bắt kịp khả năng sáng tạo và độ bền của Mythos/Fable, còn các mô hình mã nguồn mở thì sẽ lâu hơn một chút."

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim