AIの計算需要はTransformerからGPU、TSMCのCoWoS実装、味の素ABF(世界95%)、IBIDEN基板、村田のMLCC(GB200に44万個)、SiC電力へと降りる。スケーリング則とブロックチェーン融合まで、日本が握る独占層と投資の臨界を一次データで解剖する。
生成AIの性能を支える計算需要は、最終的にごく少数の日本企業が握る基盤部材へ降りてくる。中核技術は2017年の論文「Attention Is All You Need」が生んだTransformerで、その並列計算がNVIDIAのGPUを要し、GPUはTSMCのCoWoS実装、味の素のABF絶縁膜、IBIDENの基板、村田製作所のMLCC、SiCパワー半導体という日本優位の層へと連なる。モデルの賢さばかりが報じられる一方で、価値が下層に沈む独占構造と、スケーリング則が示す投資の臨界点を、一次データから解剖する。
「AIの仕組み」5層と検証
| 項目 | 内容(整理) | 検証・出典 |
|---|---|---|
| Transformer基盤 | 2017年「Attention Is All You Need」。RNN/CNNの逐次制約を克服し並列化 | ✓ Vaswani et al.(Google、2017) |
| 構成要素 | Tokenization+Embedding(位置エンコード)/MHSA(Q・K・V、scaled dot-product、causal mask)/FFN(GELU・SwiGLU)/Residual+LayerNorm/Unembedding+softmax/Decoder-only(GPT)・Enc-Dec(T5) | ✓ 各モデル技報の標準構成 |
| 処理フロー | 並列(Attention・FFN)+直列(層スタック・autoregressive)、KV cacheで線形化、Tensor/Pipeline/Data並列+AllReduce | ✓ 確立した分散実装 |
| エコシステム | 学習(DGX SuperPOD・Megatron・DeepSpeed/FSDP・ZeRO・BF16/FP8)/推論(vLLM・PagedAttention・continuous batching・量子化・MoE)/評価(MMLU・HumanEval) | ✓ NVIDIA技報・各OSS |
| スケーリング則 | Kaplan(2020)モデルサイズ重視/Chinchilla(2022)データ1:1・約20トークン/パラメータ・70Bで1.4兆トークン | ✓ Kaplan(OpenAI)・Hoffmann(DeepMind) |
| ブロックチェーン関連 | 分散性・ネットワーク効果の類似/zkML検証/DeAI計算市場/provenance(来歴)・DAO統治 | △概念・初期実装段階 |
| 日本の基盤(裏) | ABF(味の素)/FC-BGA(IBIDEN)/MLCC(村田)/SiC・GaN/Rapidus/さくら・ソフトバンクGPU/政府投資 | ✓ 各社IR・METI(本稿で実数検証) |
なぜTransformerは並列で速いのか
現代の大規模言語モデル(LLM)の土台は、2017年にグーグルのVaswaniらがまとめたTransformerである。文章を前から順に処理するRNNと違い、自己注意(Self-Attention)で全トークンの関係を一度に計算する点が革新だった。中核の多頭自己注意(MHSA)は、各トークンをクエリ(Q)・キー(K)・バリュー(V)の三つのベクトルに射影し、QとKの内積を次元数の平方根で割って正規化(scaled dot-product)、softmaxで重みを得てVを加重和する。複数のヘッドが異なる部分空間の関係を並行して捉え、生成時は未来を見ないよう因果マスクをかける。
この設計が速さを生む。注意計算と、続く2層の全結合層(FFN、活性化はGELUやSwiGLU)は、トークン位置やヘッドごとに独立して走るため、GPUのテンソル演算器で大規模に並列化できる。一方で層の積み重ねと、一語ずつ出力する自己回帰生成は逐次依存が残り、ここは過去のK・Vを保持するKVキャッシュで計算量を線形に抑える。語彙は5万〜20万、内部次元(d_model)は512から4096超、文脈長は数千から数百万トークンに及び、この三つがモデルの容量を規定する。並列で学習を速め、逐次をキャッシュで救う——Transformerの実力は、この非対称の設計に宿る。
学習から推論までのエコシステム
AIはモデル単体ではなく、学習と推論の巨大な装置産業として動く。学習側は、Common Crawlや書籍・コードなど数兆トークンのコーパスを前処理し、NVIDIAのDGX SuperPODのような分散GPUクラスタへ流し込む。層内を割るテンソル並列(Megatron)、層をまたぐパイプライン並列、データ並列を組み合わせ、メモリはZeRO(DeepSpeedやFSDP)で分散保持する。計算はBF16やFP8の混合精度で行い、勾配の集約はInfiniBand上のAllReduceが担う。主要4社の2026年のAI設備投資が前年比約77%増の約7,250億ドルに達する見通しなのは、この学習装置の膨張を映す。
推論側は別の最適化が要る。vLLMやTritonがサービングを担い、PagedAttentionでKVキャッシュを断片化管理し、リクエストを動的にまとめる連続バッチングで処理量を上げる。重みはINT8やINT4へ量子化し、下書きモデルで先読みする投機的デコーディング、専門家を疎に活性化するMoE(混合専門家)で演算を間引く。学習が「規模の経済」なら、推論は「待ち時間とコストの工学」であり、両者を貫くのが有限のメモリ帯域という制約だ。エコシステムの設計巧拙が、同じモデルでも実効性能と単価を大きく分ける。
スケーリング則が決める投資の臨界
どれだけ投じれば賢くなるかを定式化したのがスケーリング則である。2020年にOpenAIのKaplanらは、損失がモデルサイズに対しべき乗で下がると示し、パラメータ数の拡大を重視した。これに修正を迫ったのが、2022年のディープマインドによるChinchillaだ。固定の計算予算のもとでは、パラメータ数とデータ量をほぼ1対1で増やすのが最適で、目安はパラメータ1個あたり約20トークン、700億パラメータのモデルなら1兆4,000億トークンが釣り合うとした。それ以前の巨大モデルが、データ不足のまま訓練されていた事実を突いたのである。
含意は重い。計算とパラメータを増やしても、見合うだけの高品質データがなければ性能は伸びない。英語圏の良質テキストが枯渇に近づくなか、合成データや継続学習、専門領域データの囲い込みが次の主戦場になる。日本にとっては、日本語と多言語の質の高いコーパスが相対的に乏しいことが弱みであり、同時に独自データを持つ企業の希少価値が高まる局面でもある。スケーリング則は「いくら積むか」だけでなく、「何を積むか」を投資判断の中心に押し上げた。
計算需要が落ちるTSMC実装の壁
Transformerの計算需要は、最後に物理の制約へ突き当たる。膨大な行列演算はNVIDIAのGPU(GB200やB200)で処理されるが、その性能はチップ単体でなく、複数のダイと広帯域メモリ(HBM)を一つのパッケージに収める実装技術で決まる。鍵を握るのが、台湾積体電路製造(TSMC)の2.5次元実装「CoWoS」だ。ロジックとHBMを中間基板の上で近接配置し、メモリ帯域のボトルネックを緩める工程で、半導体の後工程に位置する。
供給はAI需要に追いつかない。CoWoSの生産能力は2023年末の月1万3,000枚から、2024年末に約3万5,000枚、2026年末には12万〜13万枚へと約10倍に拡張される見通しだが、NVIDIA B200/GB200やAMDのMI300X/MI400の需要がそれを上回る。ボトルネックは一点でなく、2ナノ・3ナノの先端ロジック、CoWoS実装、そしてHBM3Eメモリの三つが同時に逼迫する構図に変わった。2026年第1四半期時点でCoWoSのリードタイムは50週を超え、エヌビディアのジェンスン・フアンCEOは「実装能力は2年弱で4倍になったがなお足りない」と認める。10倍に増やしてなお詰まる——AIの計算需要は、この最深部で価格と納期の形をとる。
味の素とIBIDENが握る基板の独占
CoWoSの先、チップを基板に載せる層に、日本の静かな独占がある。GPUやCPUの高密度パッケージ基板(FC-BGA)で絶縁層をなすのが、味の素ビルドアップフィルム(ABF)だ。味の素はこの絶縁膜で世界シェア95%超、統計によっては98%を握る。もとはうま味調味料で培ったアミノ酸の化学から派生した素材で、食品会社が最先端AIチップの内部を握るという、国内でほとんど語られない構図がここにある。ABF基板市場は2025年に約49億ドル、2033年に約95億ドルへ年率10.6%で伸びる見通しで、味の素は2030年までに250億円を投じて生産能力を5割引き上げる。
基板そのものを作る層も日本が強い。FC-BGA基板はユニマイクロン(台湾)とIBIDENで約74%を占め、IBIDENはNVIDIAなどAIサーバー向けの主力供給者として、岐阜の工場を2026年3月までに生産能力5割増へ拡張中である。新光電気工業も大阪で増設した。GPU基板市場は2025年の約18億ドルから2032年に約51億ドルへ年率16%で拡大する見通しで、需要の伸びがそのまま日本勢の収益に乗る。チップが微細化するほど、それを支える基板と絶縁膜の付加価値が上がるという逆説が、この層の妙味である。
GB200に44万個のMLCCの急所
電気を安定させる受動部品にも、見えない急所がある。電源の電圧変動を吸収する積層セラミックコンデンサ(MLCC)で、村田製作所が世界首位の40%超、AIサーバー向けでは約45%を握り、サムスン電機が約40%で追う。AIサーバーは従来サーバーの約8倍のMLCCを使い、基板あたりの搭載数は1万5,000個から2万個へ増え、NVIDIAのGB200 NVL72ラック1台では約44万個に達する。標準的な企業向けサーバーの約30倍であり、村田はAIサーバー向けMLCC需要が2025〜30年に年率30%で伸び、2025年度末までに倍増すると見込む。
電力を捌く層も日本が握る。AIラックの高密度給電では、炭化ケイ素(SiC)のパワー半導体が要になる。SiCはシリコンより絶縁破壊電界が約10倍高く、高電圧・高温で損失が小さいため、800ボルト級の直流給電で変換ロスを抑えられる。ロームは宮崎で8インチSiC基板を国産化し、三菱電機は熊本に8インチSiCの新工場を建てて2022年度比5倍の生産能力を狙う。演算の表舞台はGPUだが、その裏で電圧を整え、電気を逃さない部品の供給を、日本企業が押さえている。
ブロックチェーンとAIは融合するか
両技術は、分散ネットワークとネットワーク効果という骨格を共有する一方、性格は対照的だ。AIは計算が集中し出力は確率的で、NVIDIAがAIアクセラレータの8〜9割を握る中央集権に傾く。ブロックチェーンは決定論的な取引と合意形成を旨とし、分散を志向する。融合点として語られるのが、ゼロ知識証明で推論の正しさを検証するzkML、暗号インセンティブでGPUを共有する分散学習(DeAI)、学習データやモデルの来歴(provenance)を不変台帳で監査する仕組み、DAOによるモデル統治である。
日本でも芽はある。SBIホールディングスの北尾吉孝氏は2026年3月のFIN/SUMで「金融システムを完全にオンチェーン化する」と表明し、AIエージェントが自律的に資産を運用・決済する世界を見据えた。中央集権のGPU支配へのカウンターとして、分散計算と検証可能なAIは理屈の上で噛み合う。ただし計算コスト、遅延、規制という壁は高く、zkMLもDeAIもまだ研究と初期実装の段階にある。融合が実需に届くのは、エージェントが価値を自律的に動かす場面が増えてからだと見られる。
孫正義と日本のAIインフラ投資
国内では計算基盤への投資が一気に動き出した。経済産業省は経済安全保障推進法に基づき、AI計算資源の整備へ5社に総額725億円を交付し、さくらインターネットが最大の501億円を得た。同社はNVIDIAのHopperを2,000基から4,000基へ増やし、石狩データセンターにBlackwellのB200を導入、計約1万800基のGPU提供を計画する。ソフトバンクグループは北海道苫小牧に出力30万キロワット超・70万平方メートルの拠点を構え、旧シャープ堺工場を転用した大阪の施設に約10万基のGPUを約1兆円で展開する。堺は、孫正義氏が主導する日本版「Stargate」の起点に位置づけられる。
製造の自立も進む。Rapidusは北海道千歳で2ナノ半導体の量産を2027年後半に狙い、政府の支援は2026年4月時点で累計2兆4,540億円、IBMと技術提携する。政府は2040年に半導体関連で40兆円の経済効果を掲げる。資本の地図で見れば、孫氏はサム・アルトマン氏のOpenAIと総額5,000億ドルのStargateに賭け、対立するイーロン・マスク氏のxAIへ資金を移す芽は乏しい。通信ではスターリンクが日本でKDDIの「au Starlink Direct」として先行し、ソフトバンクやNTTドコモが対抗する。傘下のアーム・ホールディングス(ソフトバンクが約9割保有)は、AIの計算が増えるほど恩恵を受け、孫氏の賭けはインフラの勝者に依存しにくい構造になっている。
日本企業が直面する選択
この層構造は、日本の企業と投資家に好機と試練を同時に差し出す。好機の一つは、下層の独占がそのまま収益力に直結することだ。ABFの95%、MLCCの45%、SiCの技術といった代替の効かない層は、AI需要が増えるほど価格決定力が高まり、味の素やIBIDEN、村田製作所、ロームの利益率を押し上げる。もう一つは、さくらインターネットやソフトバンク、Rapidusが築く国産の計算・製造基盤で、主権AIの足場を国内に持てる点である。
試練も二つある。第一は一社依存の脆さだ。味の素のABFのように単一企業に集中した供給は、災害や地政学の一撃で世界のAIチップ生産を止めかねず、顧客側は二重調達を急ぐ。第二は上流への依存である。設計はNVIDIA、最先端の製造とCoWoS実装はTSMC、クラウドは米勢が握り、スケーリング則が突きつける高品質データの壁では日本語データの不足が重い。下層の独占という強みを、設計とデータという上流の弱みがどこまで相殺するか。代替不能の部材で稼ぎつつ、計算基盤とデータの自立にどれだけ投じられるかが、日本がAIの部品供給者にとどまるか、価値の設計者へ回れるかを分けると見られる。
出典確認
- 一次/公式準拠:Vaswani(2017)、Kaplan(2020)・Hoffmann(2022)、各社IR・METI・Rapidus公式・NVIDIA、調査(ABF/FC-BGA/MLCC/CoWoS)