米国の半導体輸出規制という逆風下で、中国の生成AI開発競争が新たな局面を迎えた。新興企業の「ムーンショットAI(月之暗面)」と「ディープシーク(深求智能)」が、大規模言語モデル(LLM)の性能競争で火花を散らす。特にムーンショットAIが開発した対話型AI「Kimi」が200万字に及ぶ文脈長(入力情報量)を実現し、技術的な到達点を示したことは市場に衝撃を与えた。アリババ集団などが巨額の資金を投じる背景には、米国の技術覇権に対抗しうる独自のAI生態系を築こうとする国家的な思惑が透ける。この競争は、計算基盤となる半導体を巡る地政学的な緊張と、そのサプライチェーンを支える日本企業の立ち位置にも影響を及ぼし始めている。
20億ドル調達、ムーンショットAIの突破力
2024年2月、設立1年未満のムーンショットAIが20億ドル(約3000億円)超の資金調達を完了した事実は、中国AI市場の熱狂を象徴している。このラウンドはアリババ集団が主導し、既存株主の紅杉資本(セコイア・キャピタル中国部門)や小紅書(シャオホンシュー)も参加した。これにより同社の評価額は25億ドルに達したと報じられている。巨額資金の裏付けとなったのが、同社が開発するLLM「Kimi」の技術的優位性だ。創業者の楊植麟氏は、米グーグルやメタのAI研究部門で実績を積んだ経歴を持つ。同氏が Transformer-XL や XLNet といった、今日のLLMの基礎となる論文の共著者である点は、同社の技術的深度を物語る。Kimiが当初から注目されたのは、20万字の文脈長への対応だった。これは競合である米Anthropic社の「Claude 2」が持つ10万トークン(約7.5万語)を上回る水準であり、長い論文や決算資料の読解・要約で高い性能を発揮した。さらに2024年3月には、世界で初めて200万字の長文脈処理技術を発表。これは標準的な長編小説約2冊分に相当する情報量を一度に扱えることを意味し、金融分析や法務調査といった専門分野での応用可能性を大きく広げた。
なぜ長文脈処理の競争が激化するのか
大規模言語モデルの性能競争において、なぜ「文脈長」が重要な指標となるのか。それは、モデルが一度に参照できる情報量が、回答の精度や対話の一貫性に直結するためだ。文脈長が短いモデルは、長い会話の途中で以前の指示を忘れたり、複雑な文書全体の趣旨を把握できずに部分的な情報しか返せなかったりする。技術的には、LLMの基本構造である「トランスフォーマー」アーキテクチャが持つ計算量の問題に起因する。入力情報(トークン)の長さに応じて、計算量が二乗で増加する「自己注意機構」の制約から、文脈長を伸ばすことは指数関数的に困難になる。ムーンショットAIやディープシークは、この計算量問題を克服する独自のアーキテクチャ改良に取り組んでいると見られる。例えば、関連性の薄い情報を計算から除外する「スパースアテンション」や、複数の専門家モデルを組み合わせる「MoE(Mixture-of-Experts)」などの技術が鍵となる。ディープシークは、670億パラメータを持つ「DeepSeek-V2」モデルでMoE構造を採用し、学習費用を先行モデル比で42.5%削減しつつ、推論速度を5.76倍に高めたと公表している。これは、米国の輸出規制でNVIDIA製の最新鋭GPU「H100」などが入手困難な中、限られた計算資源で性能を最大化するための必然的な進化と言える。
ディープシーク、開放戦略で生態系を狙う
ムーンショットAIが特定用途での高性能化を追求する一方、ディープシークは異なる戦略を採る。同社は開発したモデルをオープンソース(ソースコードなどを公開し、商用利用も一部許諾)として提供し、開発者コミュニティーの支持を得ることで、自社技術を中心としたAI生態系の構築を目指している。2024年5月に公開された「DeepSeek-V2」は、主要な性能指標であるMMLU(多分野知識評価)で78.0点を記録。これは米メタが公開した「Llama 3 70B」(82.0点)に迫り、中国製オープンソースモデルとしては最高水準にある。ディープシークの創業者である梁文锋氏もまた、著名なプログラミングコンテストで活躍した経歴を持つ技術者だ。同社はモデルの「透明性」と「費用対効果」を強く訴求する。API(外部から機能を呼び出す接続仕様)の利用料金を、業界標準とされる米OpenAIの「GPT-4 Turbo」の約100分の1に設定。TrendForceの2024年5月の分析によれば、中国のクラウド事業者上位3社(アリババ、ファーウェイ、テンセント)のAIサーバー向け半導体購入額は、2024年に前年比で倍増する見込みだ。安価で高性能な国産モデルの存在は、こうした国内のAIインフラ投資をさらに加速させるだろう。
米国規制が促す「自立」と「特化」
この一連の動きの背景には、2022年10月から段階的に強化されてきた米商務省による対中半導体輸出規制がある。NVIDIA製のAI向けGPU「A100」や「H100」の中国向け輸出が禁止され、その代替として開発された性能抑制版「A800」「H800」も2023年10月の規制強化で対象となった。これにより、中国企業は先端AIモデルの学習に不可欠な計算資源の確保が極めて困難になった。この「半導体不足」が、結果として中国AI企業の技術開発戦略に二つの方向性を与えたと見られる。一つは、限られた計算資源で最大限の性能を引き出すための「効率化・特化」だ。ムーンショットAIの長文脈処理への集中や、ディープシークのMoE採用による学習・推論コストの低減は、この流れに沿ったものだ。もう一つは、米国技術への依存から脱却するための「自立化」の動きである。ファーウェイ(華為技術)が独自開発したAI半導体「Ascend(昇騰)910B」は、一部性能でNVIDIA製に及ばないとされながらも、国内テック企業がこぞって採用を進めている。中国のAI開発は、最先端を追いかける「模倣」の段階から、制約を前提に独自の強みを探る「非対称な競争」の段階へと移行しつつある。
日本企業が直面する供給網の岐路
中国AIの自立化に向けた動きは、半導体製造装置や素材で世界的なシェアを握る日本企業に複雑な問いを投げかける。AI半導体の製造には、シリコンウエハー(信越化学工業、SUMCOが世界シェア約6割)、フォトレジスト(JSR、東京応化工業などがEUV用で世界シェア約9割)、製造装置(東京エレクトロン、SCREENホールディングスなど)が欠かせない。米国の規制は主に先端半導体そのものや、微細化に直結するEUV露光装置などを対象としているが、汎用的な装置や素材の多くは規制の網から外れている。中国の半導体受託製造最大手SMIC(中芯国際集成電路製造)は、旧世代のDUV(深紫外線)露光装置を駆使して7ナノメートル世代の半導体を製造しているとされ、その過程では日本の装置・素材メーカーの技術が不可欠だ。日本政府は2023年7月、先端半導体製造装置23品目の輸出管理を強化したが、中国側はこれを「米国の圧力に追随したもの」と批判している。今後、米中対立がさらに先鋭化し、規制対象が素材や後工程装置にまで拡大する可能性は否定できない。その時、日本企業は巨大市場である中国と、同盟国である米国との間で、より困難な選択を迫られることになる。中国AIの独自進化は、経済合理性だけでは測れない地政学リスクを、サプライチェーンの根幹をなす日本企業に突きつけている。
💬 この記事へのコメント 0
まだコメントはありません
最初のコメントを投稿してみましょう!⚠️ エラーが発生しました