中国のAIスタートアップDeepSeekは、新たな大規模言語モデル(LLM)「V4」を発表した。パラメータ数は1.6兆、コンテキスト長は100万トークンに達し、性能を大幅に向上させたとされる。同社は学習基盤をNVIDIA製からファーウェイ(ファーウェイ技術)製AI半導体「Ascend(昇騰)」へ移行したとみられ、中国独自のAIエコシステム構築の動きとして注目を集めている。

1.6兆パラメータ、ファーウェイ製半導体で学習か

DeepSeekが発表した新モデル「V4」は、最大1.6兆のパラメータと100万トークンのコンテキスト長を特徴とし、従来モデルから性能を大幅に向上させた。2024年に設立された同社は、設立直後からV4の開発に着手したとみられる。

開発にあたり、学習基盤をNVIDIAのフレームワークからファーウェイのAIプロセッサ「Ascend(昇騰)」に移行したとの情報もある。これは、米国の半導体輸出規制下で中国が独自のサプライチェーンを構築する動きの一環と分析されている。

資金調達も開始、事業拡大を加速

DeepSeekは事業拡大に向け、2024年4月中旬に外部からの資金調達を開始したと、中国の複数のテクノロジーメディアが報じている。調達した資金は、V4のさらなる性能向上や、新たなAIアプリケーション開発に充てられる見込みだ。

中国のAI専門家からは、V4の登場が国内のAI開発競争をさらに激化させるとの見方が出ている。DeepSeekの技術力と開発スピードは、Alibabaテンセントといった巨大テック企業に比肩する存在として、業界内で高く評価されている。

日本企業への示唆

DeepSeekの「V4」発表は、日本企業にとって複数の具体的な影響をもたらす。まず、同社が学習基盤をNVIDIAからファーウェイのAI半導体「Ascend」へ移行したことは、中国市場におけるAI開発のデファクトスタンダードが、米国製から中国製へとシフトする可能性を示唆する。これは、日本のAI関連企業が中国市場で事業展開する際、ファーウェイのエコシステムへの適合が不可欠となるリスクを提示する。例えば、日本のAIスタートアップが中国のクラウドサービスを利用する場合、Ascendベースのプラットフォームに対応できる技術力や協業体制が求められるだろう。

次に、DeepSeekの「1.6兆」パラメータと「100万」トークンのコンテキスト長という性能指標は、中国AI技術の急速な進化を明確に示す。これは、日本の製造業やサービス業がAI導入を検討する際、中国製AIソリューションが競争力のある選択肢となる可能性を意味する。特に、中国市場向けに製品やサービスを開発する日本企業は、DeepSeekのような高性能LLMを活用することで、現地ニーズに合致したAIアプリケーションを迅速に開発できる機会が生まれる。

最後に、DeepSeekが2024年に設立されながらも、わずかな期間で大規模モデルを開発し資金調達を開始した事実は、中国AI市場の競争の激しさとスピード感を示す。日本のAI関連企業や研究機関は、このスピード感に対応できるようなアジャイルな開発体制や、中国のスタートアップとの連携を模索する必要がある。さもなくば、技術的な優位性を維持することが困難になる可能性を孕んでいる。