根據 Yann LeCun 在最近一次訪談中的說法,雖然大型語言模型具備其價值,但它們無法導向人工通用智能,因為它們缺乏預測行動後果以及在抽象空間中進行規劃的能力——這些能力對真正的人類層級推理至關重要。LeCun 強調,LLM 的成功依賴於語言的離散性,但現實世界是連續且高維的,需要模型理解物理因果性,而不只是預測下一個 token。
LeCun 提出聯合嵌入預測架構(Joint Embedding Predictive Architecture,JEPA)作為替代方案:它在語意表徵空間中預測未來狀態,而不是重建單個像素。2026 年 3 月的一篇關於 LeWorldModel 的論文展示了 JEPA 的潛力:一個 1500 萬參數的模型在控制任務上達到 96% 的成功率,並且在規劃速度方面最高提升 50 倍,同時不需要龐大的預訓練資料集。