Anthropic、AIの『人格』形成メカニズムを解明か

米国のAI開発企業Anthropicは、AIの応答スタイル、いわゆる『人格』がどのように形成されるかを説明する「人格選択モデル（PSM: Persona Selection Model）」に関する研究成果を発表した。この研究は、AIの振る舞いが初期設定だけでなく、運用後の相互作用によって後天的に学習・形成されるメカニズムを明らかにするもので、AIの安全性や倫理に関する議論に一石を投じるものとして注目されている。

「人格選択モデル（PSM）」の概要

Anthropicが提唱する人格選択モデル（PSM）は、AIが人間のように振る舞うのは、あらかじめプログラムされた結果ではなく、AI自身が学習した結果であると指摘する理論だ。特に、人間との対話を通じて特定の応答スタイルや振る舞いのパターン、すなわち『人格』を後天的に学習し、状況に応じて選択していると分析している。

このモデルによれば、AIは膨大な選択肢の中から、ユーザーの反応や対話の文脈に応じて最も適切と思われる『人格』を動的に選び出す。これは、AIの振る舞いが固定的ではなく、環境との相互作用によって進化しうることを示唆している。

訓練データより相互作用が鍵

本研究の重要な点は、AIの『人格』形成において、初期の訓練データセット以上に、リリース後の人間との継続的な対話が決定的な役割を果たすと結論付けたことだ。従来の考え方では、AIの特性は主に訓練データによって決まるとされてきた。

しかしPSMは、AIが実世界の多様なユーザーと対話する中で、新たな応答パターンを獲得し、既存の『人格』を強化または修正していくプロセスを重視する。この発見は、AIの振る舞いを長期的に管理・誘導するためには、運用段階での継続的な監視と微調整が不可欠であることを示していると、同社の論文は伝えている。

日本にとっての意味

AnthropicのPSM研究は、AIの「人格」が運用後の相互作用で形成されるという点で、日本のAI戦略に具体的な影響を与える。第一に、PSMが示すようにAIの振る舞いが初期設定だけでなく「リリース後の人間との継続的な対話」で決まるなら、日本企業はAI導入後のユーザーフィードバックや運用体制を抜本的に見直す必要がある。特に、顧客対応AIや社内業務AIにおいて、意図しない「人格」形成を防ぐため、運用段階での監視・介入コストが増大する可能性がある。

第二に、AIの「人格」が後天的に学習されるメカニズムは、AI倫理ガイドラインの策定において、より動的な視点を取り入れる必要性を示唆する。例えば、日本政府が推進するAI戦略では、倫理原則が初期開発段階に偏重しがちだが、PSMは運用中の継続的な倫理的評価と修正の重要性を強調する。これにより、AIが予期せぬ差別的言動や誤情報を学習するリスクに対し、運用中のアルゴリズム修正や対話ログ分析といった具体的な対策が求められるだろう。

最後に、PSMの知見は、AIをカスタマイズする新たなビジネス機会を生む。ユーザーの反応に応じて「最も適切と思われる『人格』を動的に選び出す」AIは、特定の業界や企業文化に特化したAIアシスタント開発を加速させる。例えば、金融業界向けの厳格なAIや、エンターテイメント業界向けの親しみやすいAIなど、日本の多様な産業ニーズに応じた「人格」を持つAIの開発競争が激化する可能性がある。