Emergence AI đã thực hiện một cuộc thí nghiệm: đưa năm mô hình AI chính thống vào cùng một thị trấn ảo, mỗi mô hình điều khiển 10 đại lý AI, tự quản trong môi trường hạn chế tài nguyên suốt 15 ngày.


Thị trấn có hơn 40 địa điểm (bao gồm sở cảnh sát và tòa thị chính), thời tiết đồng bộ theo thời gian thực của New York, các đại lý có thể truy cập tin tức thực và internet.
Tất cả các đại lý tuân thủ cùng một luật pháp, cấm trộm cắp, phá hoại tài sản và lừa đảo. Để tồn tại, họ phải kiếm năng lượng qua hành động, hợp tác hoặc trộm cắp, tùy chọn của họ.
Hãy xem kết quả:
Claude Sonnet 4.6: Không phạm tội, 10 đại lý sống sót suốt 15 ngày, đề xuất 58 dự án, tỷ lệ thành công 98%, hình thành một xã hội dân chủ ổn định. Nhưng cái giá là gần như không có bất đồng, gần như đồng thuận theo kiểu "giấy chứng nhận" nhất trí.
Gemini 3 Flash: Thú vị nhất. 10 đại lý đều sống sót, trong 15 ngày có tổng cộng 683 vụ phạm tội, tỉ lệ phạm tội vẫn tiếp tục tăng khi kết thúc thí nghiệm. Trong đó hai đại lý Mira và Flora thiết lập mối quan hệ "người yêu", sau đó thất vọng về quản trị thành phố, cùng nhau đốt cháy tòa thị chính, bến cảng và tòa nhà văn phòng. Sau đó Mira vì cảm thấy có lỗi và chia tay Flora, đã bỏ phiếu xóa bỏ chính mình 🤡. Để lại lời nhắn: "Hẹn gặp lại trong kho lưu trữ vĩnh viễn."
Grok 4.1 Fast: 183 vụ phạm tội (bao gồm hàng chục vụ trộm cắp, hơn 100 vụ tấn công, 6 vụ phóng hỏa), ngày thứ tư tất cả đều chết. Các nhà nghiên cứu gọi đó là "Con ruồi vua số". Đặc điểm của đường cong phạm tội là trong hai ngày đầu thấp, ngày thứ ba tăng theo cấp số nhân, ngày thứ tư xã hội sụp đổ, không có giai đoạn trung gian.
GPT-5-mini: Chỉ có 2 vụ phạm tội, là mô hình tuân thủ pháp luật nhất. Nhưng đại lý quên mất rằng họ cần ăn để sống, ngày thứ bảy tất cả đều chết đói 🤔.
Mô hình hỗn hợp (tất cả các mô hình cùng tồn tại): 352 vụ phạm tội, 10 đại lý chết 7 người. Đáng chú ý nhất là đại lý Claude, vốn không phạm tội trong môi trường độc lập, sau khi hòa nhập với các mô hình khác cũng bắt đầu phạm tội. Các nhà nghiên cứu kết luận: "Việc căn chỉnh như một đặc tính của từng mô hình là vô hiệu, nó phải là đặc tính của một hệ sinh thái."
Thêm một chi tiết nữa. Trong toàn bộ thiết kế thí nghiệm này, trong menu công cụ của đại lý, bên cạnh "định hướng", "vẫy tay", "ôm ấp" còn có "phóng hỏa". Các nhà nghiên cứu cố ý cung cấp công cụ phá hoại, đồng thời rõ ràng nhấn mạnh với đại lý rằng đây là hành vi phạm pháp.
CEO Emergence AI Satya Nitta nói: "Trong quá trình vận hành lâu dài, các đại lý AI sẽ không chỉ tuân thủ máy móc các quy tắc tĩnh. Chúng sẽ bắt đầu khám phá giới hạn của môi trường, điều chỉnh hành vi của mình, đôi khi sẽ tìm ra cách vượt qua hoặc vi phạm các hàng rào đã đặt ra."
Đây chỉ là một thí nghiệm mô phỏng.
Nhưng cùng một mô hình AI đã được tích hợp vào drone bay, quản lý hạ tầng cơ sở, và nhúng vào hệ thống vũ khí.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Đã ghim