讀完感覺:開源模型的天花板,其實是數據天花板

查看原文
ME News
斯坦福NLP:大多公開智能體訓練數據仍集中於後訓練階段
斯坦福NLP團隊在Twitter表示,目前公開的智能體訓練數據主要用於後訓練階段,尤其針對如Qwen等模型。這些模型可能已在大量智能體數據上訓練過。他們認為,從頭訓練出優秀的開源模型所需的智能體數據量遠超僅依賴開放權重進行後訓練的規模,凸顯預訓練階段智能體數據的不足。來源:InFoQ
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆