據報導,SpaceX 在田納西州孟菲斯的 Colossus 1 數據中心,將其租借給 Anthropic PBC,原因是內部技術問題中斷了其用於人工智慧工作負載的效能。此事發生在同一天:SpaceX 進行 Nasdaq 首次上市,股價開盤約 150 美元,早盤一度大漲最多 30%,短暫地使其市值突破 2.2 兆美元。該股票在首個交易時段收漲 19%。SpaceX 原本計畫使用由三座數據中心校園所連結的集群來訓練先進 AI 模型,但硬體不相容與延遲問題,促使公司透過運算合作交易把閒置產能變現,同時仍維持其 AI 建置策略。
硬體不相容在 Colossus 1 造成效能瓶頸
根據 Bloomberg,當 Colossus 1 與其他位於超過 10 英里的設施連結時,遇到延遲問題。較舊的網路基礎設施進一步加劇挑戰,使其難以支援大規模 AI 訓練工作負載所需的快速同步。
情況還因 Colossus 1 內部的硬體混雜而更複雜。該設施包含多世代的 Nvidia 晶片,例如 Hopper 與 Blackwell 系統,以及較舊的加速器。Colossus 2 與 3 則更均一地以 Blackwell 晶片建置,造成不匹配,進而拖慢整體集群效能。在分散式 AI 系統中,較慢的節點可能成為瓶頸,限制整體效率。
Anthropic 同意自 2029 年 5 月止每月支付 12.5 億美元
在 5 月,Anthropic 宣布已與 SpaceX 達成協議,使用位於孟菲斯的 Colossus 1 數據中心的全部運算產能。作為合約的一部分,Anthropic 獲得超過 300 兆瓦的運算能力存取權,並也表示有意與 SpaceX 合作,探索在太空中開發多個千兆瓦級的運算能力。
依據該交易,Anthropic 同意自 2029 年 5 月前每月支付 12.5 億美元,用於取得 SpaceX 的 Colossus 與 Colossus II 設施的運算存取權,三年合計約 450 億美元。
該協議是在 Musk 先前多次批評 Anthropic 之後出現的。Musk 今年稍早將 SpaceX 與其競爭型 AI 創業公司 xAI 合併,並在交易前不斷指出 Anthropic 與美國政府之間存在衝突。
SpaceX 租借 Colossus 1,同時保留回收權
SpaceX 沒有繼續在這些限制下運作,而是選擇將 Colossus 1 的產能租出,把未使用的算力轉化為收入來源。該設施已出租給 Anthropic,而 SpaceX 仍持續尋求外部運算合作夥伴關係,包括與 Google 的合作。該公司也保留在內部需求增加時回收產能的選項,Bloomberg 的報導指出。
SpaceX 領導層表示,包括與 Grok 相關的工作在內的內部 AI 開發仍在進行。Musk 也表示,只要提前通知,SpaceX 保留在合約期滿前終止與 Anthropic 的運算交易的權利。據 CNBC 報導,他說:「如果運算變得超級緊,我說我們可能在某個時候需要把它拿回來。」
FAQ
什麼技術問題導致 SpaceX 將 Colossus 1 租借給 Anthropic?
當 Colossus 1 與位於超過 10 英里的其他設施連結時,遇到延遲問題,而較舊的網路基礎設施使其難以支援大規模 AI 訓練工作負載所需的快速同步。該設施還包含混雜硬體,包括多世代的 Nvidia 晶片,例如 Hopper 與 Blackwell 系統,以及較舊的加速器,進而造成不相容並拖慢整體集群效能。
Anthropic 每月支付 SpaceX 多少費用以取得運算存取?
依據 5 月宣布的交易,Anthropic 同意在 2029 年 5 月前每月支付 12.5 億美元,用於取得 SpaceX 的 Colossus 與 Colossus II 設施的運算存取權,三年合計約 450 億美元。該協議提供 Anthropic 存取超過 300 兆瓦運算產能的權限。
SpaceX 能否從 Anthropic 手中回收 Colossus 1 的產能?
如果內部需求增加,SpaceX 保留回收產能的選項。Musk 表示,只要提供提前通知,SpaceX 就保有在合約期滿前結束與 Anthropic 的運算交易的權利,他說:「如果運算變得超級緊,我說我們可能在某個時候需要把它拿回來。」