Chuyên gia khoa học hàng đầu của Microsoft, Adrian de Wynter, trong bài nghiên cứu học thuật có tựa đề "Nếu các mô hình ngôn ngữ lớn có đặc điểm con người, thì Age of Empires 2 cũng vậy", đã sử dụng trình chỉnh sửa bản đồ tùy chỉnh của Age of Empires 2 để xây dựng một perceptron 1-bit từ dê, đồng cỏ và cầu trong game, từ đó lập luận rằng logic tính toán nền tảng của ChatGPT và các mô hình ngôn ngữ lớn (LLM) về bản chất giống hệt với cơ chế kích hoạt dê trong game.
Hiện thực hóa kỹ thuật mạng nơ-ron trong Age of Empires 2: Vai trò tính toán của đồng cỏ, cầu và dê
(Nguồn: Ảnh chụp màn hình CryptoCity)
Wynter đã sử dụng chức năng kích hoạt tình huống tùy chỉnh của Age of Empires 2 để xây dựng cổng NAND từ các yếu tố trong game: đồng cỏ đại diện cho số 0, cầu đại diện cho số 1, và dê đóng vai trò bit. Khi cổng logic được kích hoạt, những con dê đóng vai trò tín hiệu đầu vào sẽ bị loại bỏ và những con dê mới xuất hiện trên đường ray đầu ra.
Thông qua cơ chế này, Wynter đã hiện thực hóa một perceptron 1-bit trong game, tức là khối xây dựng cơ bản nhất của mạng nơ-ron hiện đại. Wynter cho biết, mạng lưới do dê điều khiển này về bản chất hoàn toàn giống với công nghệ nền tảng đang vận hành ChatGPT, chỉ khác nhau về độ phức tạp và quy mô.
Thống kê về sai lệch nhân cách hóa trong 300 bài báo khoa học máy tính của Wynter
Trong bài nghiên cứu, Wynter đã phân tích hơn 300 bài báo khoa học máy tính trong hai năm gần đây và tiết lộ các con số sau:
· 57% số bài báo ngay từ khi thiết kế thí nghiệm đã mặc định LLM có các đặc điểm con người như lo âu hay đạo đức.
· Trong số các bài báo mặc định có đặc điểm này, 77% cuối cùng đưa ra kết luận rằng các đặc điểm đó thực sự tồn tại.
· Wynter coi kết quả này là thiên lệch xác nhận (confirmation bias), cho rằng giả định nhân cách hóa ban đầu của các nhà nghiên cứu đã chi phối trực tiếp kết luận khoa học cuối cùng.
· Wynter kêu gọi giới khoa học thay vào đó sử dụng giả thuyết vô hiệu (null hypothesis) không mặc định đặc điểm con người khi tiến hành thí nghiệm.
Luận điệu thương mại của các ông lớn AI và cơ chế thị trường của việc nhân cách hóa LLM
Wynter chỉ ra rằng, chiến lược thương mại của các công ty AI đã củng cố nhận thức của công chúng về ý thức của LLM. Ông đề cập đến việc người tiêu dùng có xu hướng trả tiền hơn khi họ đồng cảm được với sản phẩm, và quy luật này áp dụng cho cả máy nướng bánh mì lẫn dịch vụ đăng ký LLM.
Wynter đã trích dẫn ba trường hợp trong bài nghiên cứu: CEO của OpenAI, Sam Altman, nhiều lần ám chỉ rằng xây dựng LLM là con đường dẫn đến "AI thần thánh"; cựu nhà khoa học OpenAI, Ilya Sutskever, từng thảo luận với nhân viên về việc coi mô hình của công ty như "ý thức thần thánh"; CEO của Anthropic, Dario Amodei, nói với truyền thông rằng "không thể chắc chắn liệu AI có ý thức hay không". Những phát biểu trên đều được Wynter trích dẫn trong bài nghiên cứu, không phải là cách giải thích cá nhân của Wynter về quan điểm của ba người.
Các câu hỏi thường gặp
Wynter đã xây dựng mô hình AI hoàn chỉnh trong Age of Empires 2?
Wynter hiện thực hóa một perceptron 1-bit (perceptron) trong game, tức là khối xây dựng cơ bản nhất của mạng nơ-ron hiện đại, chứ không phải một mô hình AI hoàn chỉnh. Mục đích của bài nghiên cứu là để cho thấy cùng một logic tính toán nền tảng tồn tại đồng thời trong cơ chế kích hoạt dê của game và công nghệ nền tảng của ChatGPT, qua đó giải thích rằng nhận thức của mọi người về đặc điểm nhân cách hóa của ChatGPT chủ yếu đến từ giao diện văn bản và kỳ vọng tâm lý.
Hai con số thống kê 57% và 77% có ý nghĩa gì?
Theo phân tích thống kê của bài nghiên cứu Wynter, trong hơn 300 bài báo khoa học máy tính hai năm qua, 57% số bài báo mặc định LLM có các đặc điểm con người như lo âu hay đạo đức; trong số các bài báo này, 77% cuối cùng đưa ra kết luận rằng các đặc điểm đó thực sự tồn tại. Wynter giải thích đây là thiên lệch xác nhận – giả định ban đầu của các nhà nghiên cứu ảnh hưởng trực tiếp đến thiết kế thí nghiệm và kết luận khoa học cuối cùng.
Nhà văn khoa học viễn tưởng Ted Chiang mô tả vấn đề LLM bị nhân cách hóa quá mức như thế nào?
Theo trích dẫn trong bài viết, Ted Chiang từng viết rằng tin mù quáng rằng mô hình ngôn ngữ có ý thức cũng giống như tin rằng mỗi lần mở file Microsoft Word, bạn đánh thức nhiều cá thể ẩn trong lịch sử hội thoại, dùng phép ẩn dụ này để giải thích rằng nhận thức nhân cách hóa về LLM là một ảo giác nhận thức.