Giám đốc AI của Tencent, Yao Shunyu, bảo vệ tiến độ phát triển tại hội nghị ngày 5 tháng 6

Nhà khoa học AI trưởng của Tencent, Yao Shunyu, đã có lần xuất hiện công khai đầu tiên vào ngày 5 tháng 6 tại Hội nghị Ứng dụng AI Ngành Công nghiệp Điện toán Đám mây Tencent, nơi ông thảo luận về mô hình ngôn ngữ lớn Hunyuan 3 của công ty và phản hồi những chỉ trích rằng Tencent đã tụt hậu trong phát triển AI. Yao, người gia nhập Tencent từ OpenAI và dẫn dắt nhóm mô hình Hunyuan, tham gia đối thoại với Phó Giám đốc điều hành cấp cao Tang Daosheng của Tencent, tập trung vào chiến lược mô hình AI, phát triển sản phẩm và tương lai của các tác nhân thông minh. Nhà khoa học 28 tuổi đã xử lý sự hoài nghi từ bên ngoài bằng cách mô tả cuộc cạnh tranh AI như một cuộc đua đường dài thay vì nước rút, đồng thời cho rằng thế giới không thể chỉ dựa vào ChatGPT như một ứng dụng thống trị duy nhất.

Yao Shunyu Chi Tiết Cách Tiếp Cận Phát Triển Hunyuan 3

Tại cuộc đối thoại trong hội nghị, Yao đã mô tả ba cải tiến cốt lõi trong Hunyuan 3. “Thực ra không có bí mật. Việc xây dựng mô hình lớn ngày nay, ở một mức độ nào đó, là một công việc khá tẻ nhạt. Chúng ta nên tập trung làm đúng hạ tầng, làm đúng dữ liệu — phần thuật toán tương đối đơn giản”, Yao cho biết. Các cải tiến bao gồm xây dựng lại toàn bộ hạ tầng cho huấn luyện trước và học tăng cường, nâng cấp toàn diện hệ thống dữ liệu và đánh giá với mức nhấn mạnh cao hơn vào việc xác định các vấn đề thực sự và cải thiện chất lượng dữ liệu, đồng thời đưa ra các quyết định dựa trên “gu” trong tuyển dụng, nhịp độ phát triển mô hình và các sự đánh đổi.

Yao, người đề xuất kiến trúc ReAct trong nghiên cứu tiến sĩ, nhấn mạnh rằng nhiều quyết định trong phát triển mô hình là “dựa trên gu” chứ không phải dựa trên công thức. “Rất nhiều quyết định thực ra là dựa trên gu”, ông lặp lại nhiều lần trong cuộc đối thoại. Luận văn tiến sĩ năm 2019 của ông, có tiêu đề “Từ Dự đoán Token Tiếp Theo đến Tự động hóa Kỹ thuật số”, đã khám phá các tác nhân ngôn ngữ trong thời GPT-2. “Thời đó vẫn là thời kỳ GPT-2, và thậm chí nó cũng không thể tạo ra các đoạn văn liên tục — có rất nhiều chỗ thô”, Yao nhớ lại. “Nhưng tôi cảm thấy lúc bấy giờ GPT là một thứ rất thanh lịch, và việc xuất ra token tiếp theo là một nhiệm vụ cực kỳ đơn giản nhưng lại rất phổ quát. Tôi tin rằng một ngày nào đó nó không chỉ xuất ra token tiếp theo, mà còn có tiềm năng tự động hóa mọi thứ trên thế giới này.”

Yao xác định các tác nhân lập trình là hình thức thiết yếu nhất của các tác nhân thông minh vì chúng có tính toàn vẹn theo Turing. Ông nêu ra chiến lược 3 phần của Tencent cho phát triển tác nhân: nhấn mạnh thiết kế hệ thống toàn diện, tận dụng tối đa dữ liệu chảy ngược từ các mảng sản phẩm, và duy trì đủ trí tưởng tượng cho việc khám phá. Về chiến lược phát triển mô hình, Yao chia sẻ ba hướng: duy trì các hệ thống dữ liệu toàn diện dù mảng lập trình trở thành hướng quan trọng nhất, tận dụng dữ liệu phản hồi từ mảng sản phẩm thông qua trải nghiệm đồng thiết kế, và khám phá các nguyên lý kế tiếp trong tiến hóa công nghệ và sản phẩm.

Về các đánh đổi hiệu năng-chi phí, Yao cho biết hiệu năng là điều kiện tiên quyết để tối ưu chi phí. “Nhiều người thấy rằng dùng một mô hình mạnh thì rẻ hơn dùng một mô hình kém, vì nó làm đúng việc nhanh hơn”, ông giải thích. Ông gợi ý rằng đạt được hiệu năng mạnh với các mô hình tương đối nhỏ và duy trì hiệu năng vững chắc trên hầu hết tác vụ “có thể sẽ có giá trị hơn ở Trung Quốc ngày nay”.

Tencent Xác Định Các Yêu Cầu Tổ Chức cho AGI

Yao giới thiệu khái niệm “nửa sau của AI” trong một bài đăng blog năm ngoái; thuật ngữ này hiện đã được dùng rộng rãi trong ngành. Ông giải thích rằng cốt lõi của khái niệm này nằm ở một sự thay đổi mang tính nền tảng: trong khi nhiều thập kỷ phát triển AI trước đây tập trung vào “tìm ra phương pháp”, thì nay khi các phương pháp đã trưởng thành, “việc tìm ra các bài toán hay” đã trở nên khó hơn. “Trước đây chúng ta đã phát minh ra các phương pháp như AlphaGo để chơi cờ vây, nhưng nó chỉ chơi được cờ vây. Chúng ta tạo ra một mô hình đặc biệt cho dịch thuật, nhưng nó chỉ làm dịch. Nhưng với huấn luyện trước và huấn luyện sau, hiện nay chúng ta có một cái búa vạn năng có thể đóng vào bất kỳ cái đinh nào”, Yao giải thích. “Điều khó hơn thực ra là tìm ra các bài toán hay để giải.”

Yao cho rằng danh mục sản phẩm và các tình huống quy mô lớn của Tencent mang lại nguồn bài toán “thật” cho công nghệ AI, và đây là lý do thứ hai ông gia nhập công ty. Ông xác định văn hóa là động lực chính của mình. “Khi tôi trò chuyện lần đầu với Chủ tịch Tang và các lãnh đạo điều hành khác, ấn tượng đầu tiên của tôi là mọi người rất trung thực về những gì chúng ta làm tốt và những gì chúng ta chưa làm tốt — rất thẳng thắn, không che đậy”, Yao nói. “Tencent nhìn chung vận hành dựa trên niềm tin hơn là dựa trên các chỉ số. Văn hóa cởi mở, ít cái tôi và thực dụng này, cùng với sự cam kết với tư duy dài hạn, là then chốt để xây dựng một tổ chức AI hướng dài hạn.”

Theo Yao, nhiệm vụ quan trọng nhất trong “nửa sau của AI” là thiết lập một tổ chức dựa trên AGI dài hạn tại Trung Quốc. Tổ chức này cần xây dựng một “tam giác cân bằng”: công nghệ nền tảng vững chắc, các sản phẩm tạo ra giá trị, và tinh thần khám phá tuyến đầu.

Yao và Tang Đối Đáp Chỉ Trích Về Tốc Độ tại Hội Nghị

Trong cuộc đối thoại, Yao cho biết AI là một trò chơi dài hạn và “nửa sau” vừa mới bắt đầu. “Tôi không nghĩ ChatGPT và Claude Code sẽ chỉ là những siêu ứng dụng duy nhất — đó sẽ là một thế giới rất ảm đạm. Hôm nay giống như những năm 1970, khi máy tính cá nhân mới xuất hiện — vẫn còn rất nhiều, rất nhiều việc phải làm”, Yao nói. Ông dự đoán tương lai sẽ đa dạng hơn thay vì đơn nhất hơn, đồng thời ghi nhận rằng “các tác nhân lập trình mới chỉ bắt đầu, và trí tuệ đa phương thức gắn với thân thể — rất nhiều, rất nhiều điều mới đang dần xảy ra.”

“Trước đây, các mô hình và sản phẩm trải qua nhiều vòng khám phá và phải đi đường vòng rất nhiều. Tôi nghĩ đó là điều bình thường”, Yao nói. “Điều quan trọng hơn là liệu chúng ta có thể đối diện một cách trung thực với chính mình hay không, liệu chúng ta có thật sự chân thực hay không, liệu chúng ta có thể thấy phản hồi rồi thay đổi, và duy trì sự kiên nhẫn hay không. Đó là điều quan trọng nhất trong nửa sau.”

Tang Daosheng cho biết Tencent hoan nghênh những lời chỉ trích và đề xuất từ bên ngoài. “Chúng tôi là một công ty có nhiều định dạng kinh doanh rất đa dạng. Đôi khi chúng tôi có thể nhanh, đôi khi chậm, và ở một số mảng chúng tôi sẽ thất bại. Nhưng đây là một cuộc đua đường dài, và chúng tôi tin rằng các mô hình sẽ liên tục được lặp lại, nhu cầu người dùng sẽ tiếp tục thay đổi, và các định dạng sản phẩm mới sẽ xuất hiện”, Tang nói.

Câu hỏi thường gặp

Yao Shunyu đã công bố điều gì tại hội nghị Tencent ngày 5 tháng 6?

Yao Shunyu, Nhà khoa học AI trưởng của Tencent, đã thảo luận về cách tiếp cận phát triển mô hình ngôn ngữ lớn Hunyuan 3 tại Hội nghị Ứng dụng AI Ngành Công nghiệp của Tencent Cloud vào ngày 5 tháng 6. Ông nêu chi tiết ba cải tiến cốt lõi: xây dựng lại hạ tầng cho huấn luyện trước và học tăng cường, nâng cấp hệ thống dữ liệu và đánh giá, và triển khai ra quyết định dựa trên gu trên các mảng tuyển dụng cũng như phát triển mô hình. Yao cũng phản hồi những chỉ trích về tốc độ phát triển AI của Tencent bằng cách mô tả cuộc cạnh tranh như một cuộc đua đường dài thay vì nước rút.

Vì sao Yao Shunyu gia nhập Tencent từ OpenAI?

Trong cuộc đối thoại tại hội nghị, Yao cho biết văn hóa là lý do chính khiến ông gia nhập Tencent. Ông mô tả ấn tượng đầu tiên của mình về lãnh đạo Tencent là “rất trung thực” và “thẳng thắn, không che đậy”. Yao giải thích rằng Tencent vận hành dựa trên niềm tin hơn là các chỉ số, với “văn hóa cởi mở, ít cái tôi và thực dụng” cùng cam kết với tư duy dài hạn mà ông xem là then chốt để xây dựng một tổ chức AI dài hạn. Lý do thứ hai là danh mục sản phẩm quy mô lớn của Tencent, cung cấp các nguồn bài toán “thật” cho việc phát triển công nghệ AI.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận