2025 年整年 AI 工程社群在「MCP vs CLI」哪個更適合 Agent 工具呼叫的問題上爭論不休、Anthropic 2025 年 11 月發表的「Code execution with MCP」論文從第一原則重新定義了問題。akshay_pachaar 5/10 整理 thread說明:問題從來不在協議本身、而在「session 開始時把所有工具描述塞進 context」的舊習慣;Anthropic 的解法是讓模型寫程式碼呼叫工具、運行時負責管理工具細節。新模式被稱為「Code Mode」。
舊模式的問題:150 mil tokens 中模型大部分用不到
舊 MCP 模式的浪費結構:
Playwright MCP:13,7 mil tokens(一次塞滿)
Chrome DevTools MCP:18 mil tokens
5 個 server 設定:尚未開始工作就燒掉 55 mil tokens
單一 workflow 完整執行:可膨脹到 150 mil tokens
模型實際用到的:絕大部分都用不上
批評者主張改用 CLI、但 CLI 在多租戶 app 容易出錯、缺乏 typed contract、agent 在不熟悉 API 上要花輪次解析輸出文字。兩派各有理、但都把問題定位錯。
解法:模型寫 code 呼叫工具、不再從 context 直接 call
Anthropic 提出的「Code Mode」核心:
翻轉模型角色:不是模型透過 context 呼叫工具、而是模型寫程式碼、由 runtime 呼叫工具
工具住在 runtime 裡、模型只看到自己 import 的部分
type 跟著 import 走、模型 import 哪個工具就拿到哪個的型別合約
用 Bash 呼叫已安裝的二進位檔(git、curl 等)
用 typed module imports 呼叫專有 API
Anthropic 範例:Google Drive 文字記錄流入 Salesforce CRM 更新。舊作法載入兩邊工具 schema、把整段文字記錄透過模型傳兩次;新作法 10 行 TypeScript 只 import 需要的、同樣任務從原本的 150 mil 壓到 2 mil tokens、減 98,7%。
Cloudflare 推到極限:2.500 個 endpoint API、從 1,17 milhones tokens 壓到 1K
Cloudflare 做了最激進的版本:
原始 API 規模:2.500 個 endpoint、schema 合計 1,17 milhones tokens
新作法:只暴露兩個函式 search 與 execute、總計 1K tokens
Agent 寫程式碼先 search 工具目錄、再 execute 對應的工具
壓縮比:超過 1.000 倍
「MCP 已死」的說法錯了—Anthropic 公布 MCP SDK 下載量已達 300 millones、年初為 100 millones、是當前成長最快的 Agent 基礎建設之一。死的是「session 開始時把所有工具一次載入」這種寫法、而那本來就是壞主意。對 2026 年寫 Agent 的開發者、規則簡單:工具定義屬於 code、不屬於 context;模型寫幾行程式碼呼叫、runtime 處理其餘部分。
後續可追蹤的具體事件:MCP SDK 下載量從 300 millones 繼續攀升的速度、Anthropic 是否將 Code Mode 標準化為 MCP 規範的官方推薦模式、以及 OpenAI、Google、Cursor 等其他 Agent 平台對 Code Mode 的採納進度。
這篇文章 Anthropic Code Mode 解 MCP vs CLI 之爭:工具住 runtime、tokens 從 150 mil 壓到 2 mil 最早出現於 鏈新聞 ABMedia。
Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el
Aviso legal.
Artículos relacionados
La plataforma B.AI agrega 8.756 usuarios el 11 de mayo, DeepSeek-V4 impulsa el 60% del consumo de tokens
Según B.AI, la plataforma añadió 8.756 nuevos usuarios el 11 de mayo, mientras que la adopción de pagos de Stripe entre los usuarios pagadores principales alcanzó el 69,0%, lo que refleja una mejor retención de los desarrolladores tradicionales y de los usuarios de nivel producción. Los modelos de la serie DeepSeek-V4 representaron casi el 60% del consumo de tokens, aprovechando la latencia ultrabaja, la alta concurrencia y las capacidades de rendimiento para servir como un motor central de ejec
GateNewsHace14m
Esta semana se intensifican los catalizadores macro: una visión general desde la publicación del IPC hasta la revisión del proyecto de ley CLARITY
2026 年 5 月中旬,加密货币市场正经历一个极为罕见的宏观敏感窗口。美国 4 月 CPI 数据于 5 月 12 日公布,川习北京峰会定于 5 月 13 日至 15 日举行,参议院银行委员会则将在 5 月 14 日审议 CLARITY 法案(数字资产市场清晰法案)。三个独立但高度关联的事件在短短四天内集中落地,形成对加密资产定价机制的阶段性压力测试。 5 月 12–15 日的事件日历与信息密度分布? 从信息释放节奏来看,本周的关键节点呈“三峰”排列:周二的 CPI 数据率先打开第一个信息窗口,周四的 CLARITY 法案审议与周四至周五的川习峰会几乎同步推进。CPI 数据的市场消化窗口约为数小时,主要影响利率预期定价;CLARITY 法案审议的决定性在于它可能推动立法进入参议院全体表决阶段,进而影响数字资产的长期监管预期;川习峰会的博弈结果则会在更大范围内冲击全球风险资产的估值中枢。三个事件共同营造出高度压缩的时间窗口,市场面临同时消化多个方向信息的压力,这本身就是波动率提升的典型前提条件。 今晚的 CPI 数据为何成为加密市场的“第一道关口”? 摩根士丹利全球宏观策略主管 Matt
GateInstantTrendsHace36m
La startup de voz con IA Vapi completa la $50M serie B liderada por Peak XV Partners
Según TechCrunch, Vapi, una startup de voz con IA, completó una ronda de financiación de Serie B de 50 millones de dólares liderada por Peak XV Partners, con una valoración post-money de aproximadamente 500 millones de dólares. Ring, la subsidiaria de Amazon, desplegó Vapi para gestionar el 100% de sus llamadas entrantes después de evaluar a más de 40 proveedores de voz con IA, ayudando a impulsar la ronda de financiación.
GateNewshace1h
La precisión de GPT-5.4 cae de 100% a 54% en ARC-AGI tras la resumir repetidamente la memoria
De acuerdo con Beating, un reciente estudio sobre la memoria de agentes de Dylan Zhang, estudiante de doctorado en la Universidad de Illinois, encontró que resumir repetidamente las experiencias del modelo puede degradar el rendimiento en lugar de mejorarlo. En tareas ARC-AGI, GPT-5.4 logró 100% de precisión en 19 problemas sin memoria, pero después de múltiples rondas de compresión de memoria basadas en trayectorias de solución correctas, la precisión cayó a 54%. De manera similar, en tareas de
GateNewshace1h
NVIDIA y el MIT publican el framework Lightning OPD, mejorando 4x la eficiencia de la destilación de modelos mientras eliminan los problemas de memoria de la GPU
Según los informes, investigadores de NVIDIA y del MIT lanzaron Lightning OPD (Offline On-Policy Distillation), un nuevo marco de post-entrenamiento para modelos de lenguaje grandes que elimina la necesidad de mantener un modelo docente en funcionamiento durante el entrenamiento. Al precomputar las log-probabilidades del modelo docente sin conexión, el marco mejora la eficiencia del entrenamiento en 4x y libera todos los recursos de GPU para el entrenamiento del modelo estudiante. En pruebas con
GateNewshace1h
OpenAI amplía el programa de acceso confiable a decenas de empresas europeas el 12 de mayo
Según los informes del 12 de mayo, OpenAI anunció planes para ampliar su Programa de Acceso de Confianza a docenas de empresas europeas.
GateNewshace1h