生成AIの応答停止が頻発する「トークン危機」の正体は、米エヌビディア製GPUの供給不足と、その製造を支える先端実装技術の生産能力限界である。OpenAIや米アンソロピックなど大手AI開発企業が直面する計算資源の制約は、AI半導体の推論市場で9割超の占有率を握るエヌビディアへの過度な依存が背景にある。この供給網のボトルネックは、台湾積体電路製造(TSMC)の先端実装工程に集中しており、結果としてディスコや信越化学工業など、日本の装置・材料メーカーの戦略的重要性がかつてなく高まっている。
「トークン枯渇」が隠蔽するGPU供給の現実
生成AIサービスで頻発する応答遅延や機能停止は、俗に「トークン枯渇」と呼ばれるが、その本質は物理的な計算資源、すなわちGPU(画像処理半導体)の不足である。トークンとは、AIが文章や画像を処理する際の最小単位を指す。例えばOpenAIの「GPT-4」では、日本語1文字が約1.5トークンに換算される。モデルが大規模化し、利用者が急増するほど、このトークンの処理要求は指数関数的に増大する。米調査会社セマフォールが2023年9月に報じた内容によれば、GPT-4の運用コストは1日あたり70万ドルに達し、その大半を計算資源の運用費が占める。このコスト増大の根源が、AIの学習・推論に不可欠なエヌビディア製GPUの供給制約だ。同社のデータセンター向けGPU「H100」は、1基あたり4万ドル前後と高価ながら、需要に供給が全く追いついていない。米金融大手シティグループの2024年3月の分析では、2024年におけるH100の世界需要が約200万基であるのに対し、供給可能量は150万基に留まると予測されており、約50万基の供給不足が生じる計算だ。この需給の不均衡が、AI開発企業のサービス提供能力を直接的に制限し、利用者からは「トークンが足りない」という形で観測されているに過ぎない。
なぜAI半導体の供給は滞るのか?
AI半導体の供給律速段階となっているのは、製造最終盤の「後工程」に分類される先端実装技術、特にTSMCが提供する「CoWoS(Chip on Wafer on Substrate)」である。エヌビディアのH100や次世代機「B200」は、複数のGPUダイと広帯域メモリー(HBM)を一つの基板上に高密度に集積する複雑な構造を持つ。この実装を担うのがCoWoSであり、論理演算を行う半導体チップをシリコン製の土台(インターポーザー)に載せ、さらにパッケージ基板に実装する技術だ。米調査会社Yole Groupの2024年5月の報告書によると、TSMCのCoWoS生産能力は2024年末時点で月産3万5000枚程度と推計されるが、エヌビディアだけでその大半を占有している。AMDの「MI300X」やグーグルの「TPU」など競合製品も同じCoWoS技術に依存するため、生産能力の奪い合いが激化している。TSMCは2025年末までに月産能力を6万枚へ引き上げる計画を発表しているが、それでもAI半導体全体の需要増には追いつかない見通しだ。CoWoS工程には、ダイシング(チップの切り出し)やグラインディング(薄化)、ボンディング(接合)といった精密加工が不可欠であり、これらの装置や関連材料の供給能力もまた、全体の生産能力を規定する要因となる。
日本勢が握る供給網の「関所」
AI半導体の供給網において、日本の装置・材料メーカーは代替困難な「関所」としての地位を確立している。特にCoWoSのような先端実装工程では、その重要性が際立つ。例えば、シリコンウエハーを極めて薄く削るグラインダー装置ではディスコが世界市場の約7割、ウエハーを個々のチップに切り分けるダイシングソーでも同等の占有率を誇る。H100のように複数のチップを高密度に積層するには、ウエハーを従来比で数分の一の薄さに研磨する必要があり、同社の技術は不可欠だ。また、チップを積層する際に生じる微細な凹凸を平坦化するCMP(化学機械研磨)装置では、荏原製作所や東京エレクトロンが強みを持つ。材料面では、チップ積層時の封止材で住友ベークライトが、またHBMの性能を左右する層間絶縁膜では味の素ファインテクノの「ABF(味の素ビルドアップフィルム)」が事実上の世界標準となっている。半導体市場調査会社TechInsightsが2024年1月に公表した分析によれば、先端パッケージング材料市場における日本企業の合計占有率は50%を超えており、特に収益性の高い分野で支配的な地位を築いている。これら日本企業の生産能力や技術開発の動向が、エヌビディアやTSMCの生産計画、ひいては世界のAI開発競争の速度を直接左右する構造となっている。
米国規制が迫る中国AI産業の袋小路
米国の対中半導体輸出規制は、中国AI企業が直面する計算資源不足を決定的に悪化させている。2023年10月に更新された米商務省産業安全保障局(BIS)の規制により、エヌビディアはH100やA100だけでなく、中国市場向けに性能を落とした「H800」「A800」の輸出も禁止された。これにより、アリババ集団やテンセント、百度といった中国の巨大IT企業は、最新のAIモデル開発に必要な高性能GPUの調達経路を事実上断たれた。TrendForceの2024年4月の調査では、中国の主要クラウド事業者が保有するAIサーバー用半導体のうち、高性能GPUの割合は2023年初頭の約80%から、2024年第1四半期には50%以下に急落したと指摘されている。代替策として華為技術(ファーウェイ)傘下のハイシリコンが開発した「Ascend 910B」などが存在するが、その性能はエヌビディア製GPUに及ばず、また製造を中国のSMICに依存するため、7ナノメートル級の先端プロセスでの量産能力には限界がある。結果として、中国企業は既存の旧世代GPUを酷使するか、闇市場を通じて高値で密輸されたGPUに頼らざるを得ない。この状況は、中国のAI技術開発の速度を鈍化させるだけでなく、計算資源の獲得コストを高騰させ、企業の収益性を圧迫する深刻な足かせとなっている。
日本企業が直面する選択と好機
AI半導体を巡る供給網の構造変化は、日本の関連企業に大きな事業機会をもたらす一方、地政学的な緊張の最前線に立つリスクもはらむ。ディスコや東京エレクトロンといった装置メーカー、信越化学工業やJSRといった材料メーカーは、先端半導体製造に不可欠な存在として、空前の需要を享受している。ディスコの2024年3月期決算では、レーザーソーなど先端パッケージング向け装置の売上高が前年同期比で40%以上増加した。これは、AI半導体への投資が同社の業績を直接押し上げている証左である。しかし、この地位は同時に、米中の技術覇権争いにおける日本の立ち位置を複雑にする。2019年の韓国向けフッ化水素輸出管理強化の事例が示すように、日本の材料・装置産業は外交的な手段として利用されうる。米国が同盟国に対し、対中規制の同調を求める圧力は今後さらに強まる可能性がある。その際、巨大な中国市場を顧客とする日本企業は、事業戦略の再考を迫られることになる。自動車や製造業といったAIのユーザー企業にとっても、計算資源の安定確保は死活問題だ。国内でデータセンターを運営するさくらインターネットや、ソフトバンクグループが主導する国産大規模言語モデル(LLM)開発の動きは、計算基盤の自給率を高めようとする試みと見られる。供給網の「関所」を握る強みを活かし、国内のAIエコシステムをいかに強化していくか。日本の産業界は今、好機と危機の交差点で、戦略的な選択を迫られている。