CoinbaseのCEO Brian Armstrong氏は6月26日、同社が智譜(Zhipu AI)の最新モデルGLM 5.2と北京月之暗面(Moonshot AI)のKimi 2.7を、社内エンジニア向けのデフォルト大規模言語モデルに設定したと発表した。CoinbaseのAI支出は約半数削減され、同期間のトークン使用量は依然として指数関数的な成長を維持している。
Armstrong氏は、GLM 5.2とKimi 2.7は主に標準的なコード補助などの一般的なエンジニアリングワークフローといった通常タスクに展開されていると説明した。複雑な計画を必要とするタスクについては、エンジニアは引き続き最先端モデルを選択できる。コードレビューの段階では、Coinbaseはマルチモデル並列戦略を採用し、異なるモデル同士で出力を相互検証させることで品質基準を維持している。
Armstrong氏は、CoinbaseのAI支出が約半数削減された結果を、以下の3層のインフラ再構築に起因していると述べた。
スマートルーティング:システムがプロンプトを前処理し、キャッシュヒット率とモデル価格を総合的に考慮して、タスクを最も適切で経済的なモデルに自動振り分ける。
積極的キャッシング:すべてのリクエストにキャッシュ認識機能を要求。LibreChatのキャッシュヒット率は5%から60%に急上昇した。
コンテキストの削減:エンジニアに対し、タスク切り替え時に新しいセッションを開始し、ファイル範囲を小さくすることで、無駄なトークンを削減するよう推奨。
Armstrong氏は、今回のコスト最適化の目標は使用量の抑制ではなく、AI採用規模の拡大であると強調した。彼は、エンジニアがコスト上限を設けずに任意の数のトークンとモデルを自由に使用できるようにしつつ、使用量をビジネスインパクトと連動させることを目標としていると述べた。Armstrong氏は、このモデルはどの企業でも参考にできると考えており、上記の見解は彼個人の公開発言である。
GLM 5.2は中国のAI企業智譜(Zhipu AI)の最新公開モデルであり、Kimi 2.7は北京月之暗面科技有限公司(Moonshot AI)の大規模言語モデルである。両モデルはオープンソース形式で公開されており、Armstrong氏はCoinbaseがこれらを通常のエンジニアリングタスクシナリオに展開し、複雑なタスクには引き続き最先端モデルを使用していると説明した。
Armstrong氏の説明によると、コスト削減の核心は3層のインフラ再構築である:スマートルーティング(タスクを最も経済的なモデルに自動割り当て)、積極的キャッシング(LibreChatのキャッシュヒット率が5%から60%に上昇)、コンテキストの削減(無駄なトークンの削減)。これに加えて、コストの低い中国のオープンソースモデルを採用し、一部の米国最先端モデルの通常タスク使用量を代替することで、全体的な支出をさらに圧縮した。
Armstrong氏の2026年6月26日の公開声明によると、彼はGLM 5.2とKimi 2.7の採用に関連するデータセキュリティ審査の詳細やコンプライアンスの取り決めには言及していない。Coinbaseは米国規制下の暗号資産取引所であり、関連するコンプライアンスフレームワークの具体的な内容は今回の声明では開示されていない。