中国の石油化学最大手、中国石油(ペトロチャイナ)化工集団(シノペック)が構築した「石油化学産業向け高品質データセット」が、中国工業情報化部傘下の研究機関による評価に合格した。新華社通信が伝えた。国家標準の評価に合格した業界特化型の高品質データセットは中国国内で初めてとなる。
中国初、国家標準に準拠したAIデータセット
今回評価に合格したデータセットは、シノペックが主導して開発したもので、石油化学産業特有の専門用語、化学反応式、分子式などを体系的に網羅している。データの品質は業界最高水準に達しているとされ、産業分野における人工知能(AI)活用の基盤となることが期待される。
評価を実施したのは、工業情報化部電子工業標準化研究院。この認定は、同データセットがAIモデルの訓練データとして、品質、完全に性、標準化の面で国の定める要件を満たしたことを意味する。これにより、中国の石油化学産業におけるデジタルトランスフォーメーション(DX)が加速する可能性がある。
独自LLM開発と業界標準化を推進
このデータセットは、シノペックが独自に開発する大規模言語モデル(LLM)「Great Wall(Great Wall)」の訓練に直接活用される。さらに、分子構造の解析や新物質の生成、プロセスの監査など、より専門的なAIモデルの開発も支える計画だ。
データセットの構築にあたり、シノペックは自社開発の統合ツールキットを導入。これにより、グループ内の86部門、約900人の従業員がデータ加工・処理作業を効率的に行える体制を整えた。この標準化された構築手法は、中国の石油化学産業全体にとって、データ資産を整備する上でのモデルケースとなりそうだ。
日本の関連性
シノペックが石油化学AI向けデータセットで中国初の国家標準に合格したことは、日本企業にとって複数の影響をもたらす。まず、同社の独自LLM「Great Wall」がこの高品質データセットで訓練されることで、中国の石油化学産業におけるAI活用が急速に進展する可能性が高い。特に、分子構造解析や新物質生成といった研究開発分野でのAI活用は、日本の化学・素材メーカーが競争力を維持するために、自社のAI開発戦略を再検討する必要性を突きつける。シノペックが86部門、約900人の従業員を動員し、データ加工・処理を効率化した体制は、中国のDX推進における組織的な実行力の高さを改めて示している。
次に、このデータセットが国家標準に合格したことで、中国の石油化学産業全体におけるデータ駆動型開発が加速する。これは、日本のプラントエンジニアリング企業や産業機械メーカーにとって、中国市場でのビジネスモデル変革を迫る。例えば、従来の設備販売だけでなく、AIを活用した生産最適化や予知保全サービスといった付加価値の高いソリューション提供が求められるようになるだろう。
最後に、シノペックが構築したデータセットの「業界最高水準」という評価は、中国が特定産業分野でのAI基盤構築において、世界的なリーダーシップを確立しつつあることを示唆する。これは、日本の政府や産業界が、AI関連のデータ標準化や共有基盤整備において、より積極的な国家戦略を策定する必要があることを浮き彫りにする。中国の「Great Wall」のような大規模プロジェクトの進捗は、日本の産業競争力にとって直接的な脅威となり得る。