神秘“歡樂馬”空降屠榜,碾壓Seedance 2.0,視頻AI又變天了?

robot
摘要生成中

周二深夜,AI圈炸了。

在全球知名AI評測平台Artificial Analysis的Video Arena榜單上,一個代號為**「HappyHorse-1.0」**的神秘影片生成模型悄然空降——沒有發佈會,沒有技術部落格,沒有任何公司背書,直接以碾壓式的姿態登頂榜首。

截至發稿,文字生影片賽道,Elo積分飆至1357分,領先剛登頂五天的Seedance 2.0 84分,比第三名和第四名的SkyReels V4和Kling 3.0 1080p Pro高出超過100分。HappyHorse-1.0一個模型,就拉開了整個產業梯隊的差距。

影像生影片賽道更是跑出了1402的恐怖高分,刷新了該榜單的歷史紀錄。

唯一稍顯遜色的,是在包含原生音效的「影片+音頻」綜合排名上,HappyHorse屈居第二,略低於Seedance 2.0。

這個榜單,沒那麼容易刷

很多人第一反應是:這不會是刷分吧?

這個質疑並非沒有道理。但Artificial Analysis的排名機制,決定了它比普通跑分榜更難被輕易操控——所有排名均來自全球真實使用者的「蒙眼二選一」盲測投票,使用者在完全不知情的情況下,對兩段生成結果進行對比選擇,最後彙總成Elo積分。

模型團隊無法透過刷題作弊,反映的是一般人看過之後最真實的感知偏好。

當然,也有人指出,Artificial Analysis的盲測樣本中人像生成、口播類內容占比超過60%,而HappyHorse在人像情境上天然具備優勢,這在一定程度上可能造成了評測分數與實際綜合能力之間的落差。

X上的討論者也因此分成了兩派:懷疑派認為HappyHorse與Seedance 2.0在人物細節、動態連貫性上仍有可見差距;支持者則對其潛力寄予厚望,尤其期待它能解決多鏡頭序列中畫質一致性這一產業痛點。

其次,根據網上的測評,普通人對這款模型的評價普遍很高。

"歡樂馬"究竟是誰的馬?

這才是整個AI圈最想搞清楚的問題。

X上的猜測來得很快。最先被注意到的,是官網的語言排序:普通話和粵語排在英語之前。對於一個面向全球使用者的產品,這個順序相當反常——背後團隊來自中國,基本可以確認。

名字本身也是線索。2026年是農曆馬年,「HappyHorse」這個命名藏著不太含蓄的馬年梗,今年早些時候「Pony Alpha」也玩過類似套路。於是嫌疑名單迅速拉長:騰訊和阿里的創始人都姓馬,天然在列;有人押注小米,覺得雷軍一貫低調,喜歡突然亮牌;也有人覺得氣質更像DeepSeek,畢竟DS此前曾悄悄上線過視覺模型,後來又悄悄下線了。

X使用者Passluo的評論頗為意味深長:“這匹快樂馬是誰的?阿里、騰訊,還是小米?”

技術層面的"破案"

光靠名字猜不夠,技術圈隨即開啟了福爾摩斯模式。

X使用者Vigo Zhao把HappyHorse-1.0的公開基準數據拿去和已知模型逐條核對,找到了一個高度吻合的對象:daVinci-MagiHuman——也就是今年3月上線GitHub的開源模型「達芬奇魔法人類」。

視覺品質、文本對齊、物理一致性等多項數據逐項對得上,官網結構也幾乎一樣,兩者同為單流Transformer架構,同為音影片聯合生成,支援的語言列表完全一致。這種程度的重合,很難用巧合解釋。

目前技術圈認可度較高的結論是:HappyHorse是daVinci-MagiHuman聯合開發方之一的Sand.ai,基於開源模型優化的迭代版本,核心目的是驗證模型在使用者真實偏好下的表現上限,為後續商業化落地做鋪墊。

daVinci-MagiHuman於2026年3月23日正式開源,是兩支年輕團隊合作的產物:

一支來自上海創智學院生成式AI研究實驗室,另一支是北京的Sand.ai(三呆科技)。模型採用150億參數的純自注意力單流Transformer,將文本、影片、音頻三種模態的token全部塞進同一個序列裡聯合建模。

另一條線索,指向阿里淘天

與此同時,坊間還流傳著另一個版本的猜測:

HappyHorse背後的核心團隊,來自阿里淘天集團「未來生活實驗室」,由前快手副總裁、可靈技術負責人張迪領銜。

公開資料顯示,張迪於2025年底加盟阿里,執掌淘天集團「未來生活實驗室」。該實驗室是阿里電商核心演算法團隊,集結了頂尖技術人才與核心算力資源,專注大模型與多模態前沿領域,成立僅一年有餘,已在國際頂會發表10余篇高品質論文。

值得一提的是,這一傳聞發酵的時間節點,恰好與阿里港股今日的活躍表現有所重疊——當然,這只是一個有趣的巧合,目前並無任何實錘將兩者直接掛鉤,不宜過度解讀。

這件事真正重要的訊號

不論HappyHorse最終花落誰家,這次事件傳遞的產業訊號已經足夠清晰。

長期以來,開源影片模型與閉源產品之間橫亙著一道效果層面的可見差距——在需要向客戶交付的情境裡,開源模型的生成品質始終未能跨過「可用」到「可交付」的門檻。可靈、Seedance等閉源產品的定價權,在相當程度上正是建立在這一差距之上。

這一次,一個基於開源模型的產品,在以真實使用者感知為基準的盲測排行榜上,首次正面比肩了當前主流閉源競爭對手。

對於依賴這一差距構建定價權的閉源廠商而言,這至少是一個值得認真對待的訊號。

按照Artificial Analysis的「盲測屠榜」慣例,當一個匿名模型賺足關注度後,官方通常會在一週內正式「認領」。

或許就在這幾天,我們就會知道答案了。

在這個馬年,真正值得關注的,或許不是哪匹馬跑得最快,而是賽道本身,正在變寬。

風險提示及免責條款

        市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別使用者特殊的投資目標、財務狀況或需要。使用者應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言