作者:林晚晚
1876年、フィラデルフィア万国博覧会。ブラジル皇帝ペドロ2世はベルの発明した電話を手に取り、向こう側から聞こえてきた声に驚いて叫んだ。「なんてこった、話せる!」
百五十年後の2026年3月18日、サンノゼ会議センター。黒い革ジャケットを着た黄仁勲(ヒョン・フン・黄)がGTCカンファレンスの舞台に立ち、またもや驚くべき言葉を口にした。
「十年後、NVIDIAにはおよそ7万5千人の社員がいるだろう。彼らは非常に忙しくなる。なぜなら、750万のAIエージェントと一緒に働く必要があるからだ。」
会場の笑いが起きた。
7万5千人、750万のエージェント、1:100。
黄仁勲自身も笑いながら付け加えた。「彼らは24時間働き続ける。私たちの社員は彼らと比べなくて済むことを願うよ。」
拍手が収まると、この数字はその日のより華やかなチップや協力契約に埋もれてしまった。しかし、もう一度この数字だけを取り出して考えてみると、これが大会で最も重要な一言の一つかもしれない。
黄仁勲だけではない。三ヶ月前、別の人物が同じ未来をより具体的に描いていた。
2026年1月、ラスベガスのCES。マッキンゼーのCEO、ボブ・スターンフェルスが壇上で数字を報告した。
「私たちは今、4万人の人間の社員と約2万5千のAIエージェントを抱えている。」わずか二年前にはこの数字は数千だった。その2万5千のエージェントは過去半年で250万枚の図表を生成した。
250万枚の図表。これはかつて新入社員のアナリストがやっていた仕事だ。23、24歳で、世界的な名門校の光を背負い、深夜3時に座標軸を合わせて。
それがマッキンゼーの新人の出発点だった。最も機械的な労働を通じて、パートナーへの道の切符を手に入れる。
今や、その前半部分はエージェントに取って代わられている。スターンフェルスは言う。「AIは特定の職種を25%増やし、また別の職種を25%減らした。会社はきちんと二つに分かれ、拡大する側と縮小する側に分かれている。」
NVIDIAの話とマッキンゼーの話は、同じことを語っている。
1:100の世界では、働いているのはトークン駆動のエージェントであり、人間はエージェントに接続されたインターフェースだ。
GTCのその週、黄仁勲はAll-In Podcastに出演し、より破壊力のある発言をした。
「もしあなたに年収50万ドルのエンジニアがいるとしよう。そのエンジニアが少なくとも25万ドル分のトークンを消費していなければ、私は非常に心配になる。」
司会者が質問した。「NVIDIAはエンジニアチームのために20億ドルを使ってトークンを買っているのか?」黄仁勲は答えた。「努力しているところだ。」
トークンを使わないエンジニアにとって、50万ドルは50万ドルの価値もない。
NVIDIAのアプローチは非常にシンプルだ。報酬パッケージにトークンを組み込むことだ。黄仁勲はGTCの基調講演で、未来のNVIDIAのエンジニアには年間のトークン予算が設定され、その額は基本給の約半分になると述べた。
基本給数十万ドルのエンジニアには、推論計算能力の割り当てとして半分の基本給相当のトークンが追加され、総パッケージの3分の1は純粋な燃料となる。
トークン予算を満額もらえる人は、24時間体制で10数のAIエージェントにコードを書かせたり、テストを走らせたり、文献を検索したり、シミュレーションを行ったりできる。一方、無料APIの枠だけを使っている人は、まだ手動でキーボードを叩いている。二人の履歴書はほぼ同じでも、出力は5倍から10倍違う。
これはすでにシリコンバレーでは理論ではない。
今年3月、Business Insiderはある変化を報じた。エンジニアの面接で「このポジションにはどれだけのトークン予算が割り当てられるか?」と質問し始めたのだ。Theory Venturesのパートナー、トマシュ・トゥングズは、トークン予算をエンジニアの「第四の柱」と呼び、基本給、ボーナス、株式の後に位置付けた。
OpenAIの総裁、グレッグ・ブロックマンはさらに直接的だ。「あなたが呼び出せる推論計算能力の量が、あなたの全体的な生産性をますます左右する。」
黄仁勲はGTCの講演でこうも言った。「私のポジションにどれだけのトークンがついてくるか?これもすでにシリコンバレーの採用ツールになっている。」
1950年代、デトロイトの自動車工場の賃金は全米トップクラスだった。本当に彼らを中産階級にしたのは、ヘンリー・フォードが発明したライン生産方式だ。工員はラインに立ち、動かず、各自の生産量はロボットアームによって何十倍にも増幅された。デトロイトの工員の生活水準は、同時期の手工芸職人をはるかに超えていた。技術は必ずしも優れていたわけではないが、彼らの足元にはより太いラインが走っていた。
2026年のトークン予算は、1950年のライン生産と同じ役割を果たす。
ただし、違いがある。
デトロイトの工員はフォードを離れても、ゼネラルモーターズやクライスラーに行ける。ラインはどこにでもある。労働組合は資本側と交渉し、より速いラインスピードや安全な環境を要求できる。
しかし、トークン予算は違う。あなたがその日超人だったとしても、翌日には普通の人に戻る。株式は売却して持ち出せるし、スキルも転職とともに持ち運べる。トークン予算は何も所有していないのと同じだ。外付けのスイッチは会社の手の中にある。
シリコンバレーにはこの状況を表す新しい言葉がある。「GPU飢餓(GPUハングリー)」だ。
トップクラスのAI研究者が転職すると、給与差はもう二番目の要素になりつつある。一番は計算能力だ。実験もできず、エージェントを展開できず、能力は予算に縛られる。「あなたたちがどれだけのトークンを与えるか」が時には株式よりも優先されることもある。株は遠い将来の支払い可能な小切手だが、トークン予算は今日の生産力を即時に反映する。
AIを使わない人は、すぐに排除される。
Goldman Sachsは、AIによって米国の労働時間の25%が自動化されると見積もっている。Mercerの調査では、65%の経営幹部が、20〜30%の従業員がAIによって再配置されると予測している。二つの数字を重ねると、結論は明白だ。トークンを持つ人は爆発的に生産性を上げ、持たない人は最適化されてしまう。
境界線はトークン割当と人間の能力であり、その関係はますます薄れている。
個人の価値はトークン割当で決まる。では、企業は?
2026年3月初め、上海のある企業、MiniMaxが上場以来初めての年次報告書を発表した。年間売上高は7,900万ドル、調整後純損失は25億ドル。従来の財務指標から見ると、小さな資金を燃やす会社であり、売上はアクセンチュアの四半期分にすぎない。
しかし、資本市場はそう見ていない。
MiniMaxのCEO、閻俊傑は決算発表の電話会議で、非常に重要な一言を述べた。「会社の価値は、知能密度にトークンスループットを掛けたものによって決まる。」
トークンスループットは、売上増加率やユーザー数、粗利益率ではない。
この言葉を支えるデータは非常に堅い。2026年2月、MiniMaxのM2シリーズモデルの1日あたりのトークン消費量は、2ヶ月前の12月と比べて6倍に増加した。プログラミングシナリオのトークン消費は10倍に跳ね上がった。AIモデル統合プラットフォームのOpenRouter上で、MiniMaxのM2.5は2週間で4.55兆トークンを消費し、アメリカの全モデルを押しのけて、上海の企業として初めて世界のトークン消費ランキングのトップに立った。
「南華早報」がこの出来事を報じた際、「中国のオープンソースモデルが米国開発者の1年にわたる市場支配を終わらせた」と表現した。終わらせた要因は何か?トークン消費量だ。最も多くトークンを燃やした者が勝者となる。
この論理はOpenAIにも当てはまる。OpenAIのAPIプラットフォームは毎分600億トークンを処理し、2年で20倍に増加した。年間で10万ドル超の消費をする企業顧客は、1年でほぼ7倍に増えた。Barclaysのアナリスト、ロス・サンドラーはデータを分析し、「OpenAIの消費端におけるトークン消費量はGoogle Geminiの2倍以上だ」と結論付けた。
トークン消費量は、AI企業のランキングを決める“硬貨”となった。
さらに面白いのは、この状況が企業内部でどう見えるかだ。最近、ニューヨーク・タイムズは「tokenmaxxing(トークン最大化)」という現象を報じた。MetaやOpenAIのエンジニアたちが、社内のランキングで誰がより多くのトークンを消費しているかを競い合っているのだ。
トークン予算はもはや標準的な福利厚生になりつつある。十年前の無料ランチや歯科保険のように。ストックホルムのエリクソンのオフィスで働くエンジニアは、ニューヨーク・タイムズにこう語った。「Claudeに使ったお金は、給料よりも高いかもしれない。でも、会社が払ってくれる。」
TechCrunchの先週の記事では、こう計算している。エンジニアが午後に記事を書くだけなら1万トークンを使うかもしれないが、エージェントクラスターを動かすエンジニアは、1日に何百万ものトークンを消費し、文字一つ書かずにバックエンドで燃やしている。
2年前、百万トークンの価格は33ドルだった。今や9セントだ。99.7%も下落している。価格が安くなるほど、燃やす量は増える。燃やす量が増えれば増えるほど、手放せなくなる。
閻俊傑は電話会議でこう予測した。「今後、市場のトークン需要は1〜2桁の増加になる可能性が高い。」
これが2026年に企業の価値を決める新しい方法だ。あなたがいくら稼いでいるかではなく、どれだけトークンを燃やしたかで評価される。MiniMaxは25億ドルの損失を出しているが、トークンスループットの成長曲線は非常に急であり、資本市場は投資を躊躇しない。これを2006年のYouTubeに例えると、収益はゼロだが、帯域幅の消費は指数関数的に増加し、Googleは16億5000万ドルを投じて買収した。
当時、YouTubeは帯域幅を燃やしていた。今、MiniMaxはトークンを燃やしている。単位は変わったが、論理は変わらない。
GTCの同じ週にもう一つの出来事があった。
3月18日、Stripeは「Machine Payments Protocol」を発表した。要するに、AIエージェントが自分でお金を使えるようになったのだ。
エージェントはデータセットを必要とし、自ら支払ってダウンロードする。推論のための計算能力を必要とし、秒単位で購入する。別のエージェントのAPIを呼び出し、自ら決済も行う。全て人間の確認を必要としない。Visaはこのプロトコルにクレジットカード決済を適用し、Coinbaseはエージェント専用のウォレットを作り、Mastercardは「Agent Pay」を開発中だ。
これにより、トークンの消費源が一つ増えた。以前は「人がエージェントを調整する」場面だけだったが、今やエージェント自身もトークンを消費し、そのお金でさらに多くのトークンを買い増しているのだ。Stripeの共同創業者、ジョン・コリソンはこの流れを「洪流(raging torrent)」と呼んだ。
黄仁勲は数字を示しながら語った。「NVIDIAはトークン生成速度を2200万から7億に引き上げる。350倍だ。」
これはまるで高速道路網を建設し、車の流れが指数関数的に増加することを賭けているようなものだ。
6000億ドルのインフラ投資には前提条件がある。それは、世界中のトークン消費量が十分に大きくなり、投資回収を支えられることだ。しかし、その前提は今のところ仮説に過ぎず、非常に高価な仮説だ。
2025年第4四半期、テクノロジー企業は史上最高の1087億ドルの債券を発行した。2026年の最初の数週間でも、また1000億ドル規模の債券が出ている。
Morgan StanleyとJPMorganは、今後数年でAI関連企業の借入総額が1.5兆ドルに達する可能性を予測している。Goldman Sachsの推定では、AIの資本支出はすでに米国GDPの約3%を占めている。
ウォール街で最初にリスクを嗅ぎつけた投資家たちは、すでに保険を買い始めている。クレジット・デフォルト・スワップの取引量は増加している。数十ベーシスポイントの保険料を払って、これらの企業が支払不能になるリスクを賭けているのだ。Citiの信用戦略責任者、ダニエル・ソリッドは投資家会議でこう述べた。「信用投資家として、この規模の変革に直面すると、これだけの資本投入が必要となり、本能的に不安を感じる。」
Googleの創始者、ラリー・ページは社内でこうも言った。「破産してもいい、負けたくないこの競争からは。」
これはまさに囚人のジレンマを描いている。各巨大企業は、相手が投資を続けると賭けているため、自分は止まれない。止まった者は即座に排除される。
楽観的な面もある。データによると、トークン生成速度は350倍に増加した。Stripeはエージェントに自分でお金を使わせ始めた。McKinseyは2年でエージェント数を数千から2万5千に拡大した。もしエージェント経済が本格的に始動すれば、トークン消費の成長曲線は確かに指数関数的に変わる可能性がある。
しかし、多くの人が眠れなくなる日付もある。それは2026年後半の契約更新の崖だ。
2024年から2025年にかけて、企業は「イノベーション予算」を使っていた。CEOは決算会議で「我々はAIを積極的に取り入れている」と一言述べるだけでよく、価格にはあまり敏感でなく、効果もあまり厳しく求められず、ただ姿勢を示すための支出だった。2026年後半、最初のパイロットプロジェクトが契約更新の時期に差し掛かる。イノベーション予算は使い果たされ、CTOはテーブルの向こう側の席を譲り、CFOが座る。CFOが唯一気にするのは数字だ:ROI。
もし多くの試験運用が打ち切られれば、トークンの最終的な消費には突如としてギャップが生じる。上流の6000億ドルの産能は、データセンターが建設され、電力が供給され、チップが供給された結果だが、使われずに放置される余剰能力となる。
こうした事例は過去にもあった。
2000年、通信会社は海底光ケーブルに兆ドル規模の投資をした。バブル崩壊後、世界の90%の光ケーブルは海底に沈んだまま放置され、ほぼ10年動かずにいた。Netflixのストリーミング開始やiPhoneによるモバイルインターネットの爆発的普及によって、ようやく一本一本が点灯し始めた。光ケーブルは無駄ではなかった。光ケーブルを敷設したランシックス、北電、シスコシステムズは倒産したが、インフラは残り、建設者は消えた。
2012年、中国の太陽光発電。無錫尚徳や江西サイウェイは、パネルの価格を世界のコストラインを突き破った。過剰な生産能力により、業界は3年間血みどろの競争を強いられた。その後、需要は確かにやってきた。今や太陽光は地球上で最も成長しているエネルギー源だ。尚徳は倒産し、サイウェイも倒産した。先行者たちは、夜明け前の最後の暗闇に横たわっている。
ベルが電話を発明した後、西部ユニオンは特許を10万ドルで買わなかった。10年後、西部ユニオンは2500万ドルを出して買い取り、ベルは売らなかった。30年後、電話網は全米を覆った。しかし、そのネットワークを敷設した小さな会社の多くは、電話の普及の日を迎える前に消えた。勝者は、その後買収と独占によってすべてを飲み込んだAT&Tだった。
インフラの物語はいつもこのバージョンだ。方向性はほぼ正しいが、時間差が命を奪う。
さて、トークンに戻ろう。前述の構造では、トークンは労働力に変わり、人はインターフェースになる。トークン割当がすべてを定義し、その前提はトークンが継続的かつ大量に、加速的に消費されることだ。エンジニアの10倍の生産性は、トークン供給によって支えられ、削減すればゼロになる。OpenAIの8400億ドルの評価額は計算能力の約束によって支えられ、契約が終了すれば縮小する。6000億ドルのインフラも、最終的な消費の増加によって支えられ、成長が鈍れば空回りとなる。
各層は次の層に依存している。消費の増加速度は、建設のそれよりも2〜3年遅いため、全体の価格設定は緩む。
2023年には「カードがあれば親」と言われた。2026年には「トークンがあれば親」となる。
言葉を変えただけのように聞こえるが、その下の変化は多くの人が気づいていないほど深い。
GPUは資産だ。買えばあなたのもの、サーバールームにロックされ、他人は持ち出せない。
トークンは流量だ。あなたの10倍の生産性、高評価、交渉の切り札は、すべて継続的にあなたのものではない供給に基づいている。蛇口を閉めれば、すべてがゼロになる。
トークンが本当の労働力に変われば、人はトークンに接続されたインターフェースになる。良いインターフェースはトークンの価値をより大きく引き出すことができる。判断力や美意識、経験といったものは残るが、インターフェースがどれだけ多くのことをできるかは、まずどれだけのトークンが接続されているかに依存する。