孟醒,五源資本合夥人,近日發表矽谷考察報告,提出一個讓他自己都改變記筆記習慣的判斷:矽谷正在進入一個連造浪的人都被浪淹沒的階段。AI 的迭代速度已經從「按月」變成「按週」,連矽谷自己都跟不上自己。
當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。
YC 從領先指標變成落後指標
孟醒今年 3 月坐在 YC W26 batch Demo Day 觀眾席,聽到第五家公司路演時就放下了筆。原因是這一屆超過一百家公司中,約 80% 都在做垂直 agent,例如幫律師整理文件、幫客服分發工單、幫 HR 篩選履歷。
如果是去年 10 月看到這些題目,他會覺得「挺有想法」。但 Claude Code 從開發者工具變成幾乎人人可用的介面、Opus 4.6 把 vibe coding 的門檻壓到地板之後,這些垂直 agent 在尚未建立業務壁壘前,一個普通工程師花一個週末就能複製出來。
YC 的批次制度從申請、篩選、入營、打磨到路演,是按一個更慢的世界設計的。在當前 AI 的迭代速度下,5 個月足夠發生數輪典範轉移。孟醒形容,YC 正從過去的領先指標逐漸變成落後指標。
Meta 全員用對手的產品寫程式
孟醒這次矽谷之行最大的衝擊,是 Meta 整間公司全員都在使用 Claude Code。一家市值兆級的公司,讓幾萬名工程師用競爭對手的 API 接觸自家程式碼,這在半年前完全不可想像。
Meta 內部曾推出名為 myclaw 的工具試圖解決程式碼安全問題,但「不好用,沒人用」。最後公司直接放寬政策,只要不涉及客戶資料,員工可自由使用 Claude Code,並開始召開「如何變成 AI native 組織」的內部會議與培訓。
Google 因安全考量原則上禁止員工使用對手工具,但 DeepMind 是例外,負責 Gemini 與內部應用的幾個團隊都在用 Claude Code。Google 自家內部編碼工具 Antigravity 號稱目前約 50% 的新程式碼由 AI 編寫,仍無法阻擋 DeepMind 的偏好。
其中一個關鍵是 Anthropic 為其做了私有化部署,而且 Anthropic 的推理與訓練本來就大比例跑在 Google Cloud 的 TPU 上,雙方有信任基礎;其他大廠則沒有這層關係,是真的把程式碼安全暫時擱在一邊,先把速度衝上去。
工程師的 token 花費,比工程師本人還貴
孟醒在 Palo Alto 走訪的數家 AI-native 新創公司中,一個工程師一年的 token 預算約為二十多萬美元,這個數字已經接近一個工程師的年薪。看似公司用 AI 裁人省錢,實際上總成本可能根本沒降,只是把人的成本換成了 token 成本。
Meta 把這件事推到極致,內部設立了一個 token 消耗排行榜,誰用得多誰上榜,末尾可能被裁,員工為此卷出了一個叫做「token legend」的非官方頭銜。但同一段時間,Meta 接連兩輪裁員、規模合計上萬人。一邊全員衝 token、一邊大規模裁員並不矛盾,這是同一件事的兩面。
孟醒實地看了一家 C 輪公司,技術負責人打開 Slack 給他看,全是 agent 在跑,背後並行十幾個 Cursor agent,再開一個 Claude Code 視窗負責調度。工程師圈最流行的焦慮,是睡覺前不知道我那十幾個 agent 要幹什麼,就很慌。
100 倍效率,沒有換來 100 倍營收
很多 CTO 興奮地告訴孟醒,「以前 60 個人花 1 年做的事,現在 2 個人加 Claude Code 一週就能搞定」,所謂「百倍工程師」、「十倍效率提升」。
但孟醒冷靜下來後問了一個問題:好,效率提升了 100 倍,那公司的營收增長 100 倍嗎?產品線擴張了 100 倍嗎?他沒有得到正面回答。事實是 100 倍的效率提升落到營收上,常常只體現了 50% 或一倍。差距在哪,現在沒人能說清楚。
「用了這麼多 token,公司應該基因突變成另外一種公司才對。但到底變成什麼,我也不知道。」一位創辦人這樣告訴他。連 Anthropic 自己也有跟不上的場景。孟醒問一位 Anthropic 朋友「你們自己用 agent 最痛苦的場景是什麼」,答案是 oncall 即時響應。
當 API 響應變慢、推理節點掛掉、用戶反饋輸出異常時,oncall 工程師需要快速定位是程式碼 bug、算力分配還是模型本身的問題。Anthropic 是全世界 coding agent 最強的公司,這個場景離他們的核心能力近得不能再近,他們內部的 oncall agent 仍然不好用。
蒸汽機跑得還沒馬車快,但沒人敢停下來等
孟醒形容當下的狀態:蒸汽機已經被發明出來,但有時候跑得還沒馬車快。關鍵是所有人都知道蒸汽機終將跑得更快,所以程式碼安全也不管了、token 預算爆了、排行榜卷起來了。至於蒸汽機什麼時候真的跑過馬車,沒人知道,但沒人敢停下來等那一天,因為停下來的代價,可能比燒錯 token 更大。
而 token 消耗大概率不是線性增長。孟醒援引研究機構 METR 的數據:衡量 AI agent 能以 50% 成功率完成多長任務(按人類專家完成時間算)的指標,2025 年 3 月時 Claude 3.7 Sonnet 還是 50 分鐘,到 2025 年底 Claude Opus 4.6 已經做到 14.5 小時。
過去兩年這個指標的翻倍週期,從 7 個月壓縮到 4 個月。一旦 agent 可靠性再上一個台階,token 消耗就不是每年加 50% 的問題,而是一夜之間上一個數量級。孟醒也提到一個朋友圈內共識的預測:到今年年底,不少公司(包括科技大廠)實際上只需要 20% 的人。
(回答一個問題:AI 讓你效率提升五倍,你要減少 80% 成本,還是做五倍的事?)
筆者今年 4 月曾在一篇文章中問過:當 AI 把一個團隊的生產力放大五倍,你可以減少八成人力維持原本產出,也可以維持人數做五倍的事。Aaron Levie 在 a16z Podcast 上提出,未來一間公司的 agent 數量可能是員工的 100 到 1,000 倍;黃仁勳則直言,如果世界沒有新的創意,AI 帶來的生產力提升最終只會轉化為失業。問題不在 AI,而在於決策者是否具備想像力。
孟醒這次矽谷的觀察,等於是在現場給出了答案的初稿:當 100 倍效率沒有換來 100 倍營收,當 token 預算逼近人力成本,當蒸汽機還跑不過馬車卻沒人敢停下,矽谷現在選的是「先把速度衝上去再說」。但這條路最終會走到「擴張能力」還是「壓縮成本」,目前沒有定論。
孟醒在文章結尾留下一個更平衡的視角:他這半個月看到那麼多「跟不上」確實讓人焦慮,但如果 AI 真的能在幾年內讓癌症變成慢性病、讓材料科學快進二十年,這場「跟不上」可能是人類發展史上最大的一次提速。
對企業決策者而言,真正的問題從來不是 AI 會不會取代人,而是當生產力被放大五倍、十倍、一百倍之後,你選擇用它去裁掉更多人,還是去做更多事。這個選擇,正在矽谷與全球企業的會議室裡同時發生。
這篇文章 用 AI 提升產出還是降低成本?百倍效率沒換來百倍營收,但矽谷沒人敢喊停 最早出現於 鏈新聞 ABMedia。
Related News
Đối tác YC chia sẻ cách sử dụng AI để bắt đầu xây dựng một công ty từ con số không, và các startup nên xem AI như một hệ điều hành chứ không phải một công cụ
Đại lý Cursor AI gặp sự cố! Chỉ một dòng mã mà 9 giây đã xóa sạch cơ sở dữ liệu công ty, cơ chế bảo mật bị bỏ qua chỉ còn lời nói suông
郭明錤: OpenAI muốn làm AI Agent trên điện thoại, MediaTek, Qualcomm, Luxshare Precision trở thành chuỗi cung ứng then chốt
Nhà chiến lược Bloomberg: Sau khi BGCI giảm 50%, sẽ xuất hiện thời điểm tuyệt vời để tham gia thị trường tiền mã hóa
Khóa học AI của Stanford kết hợp các nhà lãnh đạo trong ngành như Hoàng Nhân Quân, Altman, thách thức tạo ra giá trị cho thế giới trong 10 tuần!