Xの推薦AIが7週で保守化、Grok「二重ループ」の実態

XのGrokベース推薦エンジン「Phoenix」を解析。2026年1月公開のオープンソース実装、約5,000人を対象にしたNature掲載の無作為実験、エンゲージメント最適化と二重ループが世論を形づくる構造、欧州DSAと日本の統治格差までを、固有名詞と一次データで深掘りする。

Xの推薦エンジン「Phoenix」は、利用者の反応だけでなく、傘下の大規模言語モデルGrokが生み出した反応までを学習材料に取り込む自己強化型の仕組みである。推薦エンジン(閲覧履歴から表示順を決める仕組み)は通常、人の行動から学ぶ。だがxAIが2025年3月にXを買収して以降、GrokはXの投稿で訓練され、同時にフィードの中で要約・返信・生成を担う。米国の約5,000人を対象にした無作為化実験では、旧来のアルゴリズムでさえ7週間で政治的態度を保守・共和党寄りへ動かし、その効果は時系列表示に戻しても残った。より強力で結合の密なPhoenixを、外部監査なしに世界数億人へ広げる設計判断の重みを、Xの最大級市場である日本はまだ十分に測れていない。

なぜ二重ループが危ういのか

推薦システムの基本は閉じた循環にある。Phoenixが表示順を決め、利用者が反応し、その行動が学習データになり、次の表示順が変わる。ここに外部の「正しさ」や「公共性」のラベルは存在せず、唯一の基準は、過去の表示によって既に形づくられた利用者行動そのものである。xAIによる2025年3月のX取得で、この循環にもう一つの環が重なった。Grokが投稿を解釈・要約・返信し、時に隣接する内容を生成する。利用者は元の投稿だけでなくGrokの「枠づけ」に反応し、その反応が再びPhoenixとGrok双方の訓練に回る。

問題は哲学ではなく機構にある。系が自らデータを生み、そのデータを独立した真実として扱うとき、初期の小さな偏りが層をまたいで増幅する。たとえばGrokは早期に伸びた投稿へ返信しやすく、その返信自体がエンゲージメント(いいね・返信・再投稿などの反応総体)として加算され、Phoenixのスコアを押し上げ、露出がさらに広がる。どの話題に言語モデルが最初に注目するかという僅かな差が、「この立場を推せ」という規則を誰も書かないまま、可視性の大差に膨らむ。コードは4週間ごとに更新され、数億の相互作用で連続的に再学習される。「自然発生的なエンゲージメント」という概念は、ここで分析的に不安定になる。利用者の意図と系の影響を、もはやきれいに切り分けられないからである。

Grok-1派生Phoenixの設計

技術的事実に争いはない。xai-orgが2026年1月20日に公開したリポジトリ「x-algorithm」によれば、Phoenixは二段構成を採る。第1段の検索では、利用者と投稿を埋め込みベクトルに変換する二塔(two-tower)モデルが、近似最近傍探索(ANN、厳密一致を避けて高速に近い候補を引く手法)で数百万件から数百件へ絞る。第2段の格付けでは、いいね・返信・再投稿・リンク遷移・フォロー・ブロック・ミュート・通報といった複数の反応確率を予測し、加重式で最終スコアに統合する。この格付け用transformerは、xAIが公開したGrok-1から移植され、候補同士が推論時に互いを参照しないcandidate isolation(候補隔離)のためのattention maskingを加えてある。

設計思想の転換が決定的だ。Xは2026年1月の更新で「手作業で設計したあらゆる特徴量とほとんどの発見的規則」を取り除き、関連性の判断を訓練済みモデルへ全面委譲した。2023年3月に旧Twitterが公開したthe-algorithm(Heavy RankerやSimClustersなど人手の指標を多用)からの世代交代である。フィードの供給源も二系統に整理され、フォロー内はThunder、フォロー圏外は地球規模の投稿群から掘り起こすPhoenix retrievalが担う。実装の大半はRustとPythonで書かれ、コードは4週ごとに更新される。透明性の度合いでは、推論の中身を一切示さないYouTube、TikTok、Meta(Instagram・Facebook)を上回る。同じ反応最適化の系列に属しながら、Xだけが内部を見せている点が、皮肉にも論点を鋭くしている。

5,000人実験が示した持続効果

世論形成の証拠は、推測ではなく対照実験にある。Bocconi大学のGermain Gauthier氏らが2026年にNature誌へ発表した論文「The political effects of X's feed algorithm」は、2023年夏に米国の能動的利用者約5,000人を、アルゴリズム表示と時系列表示へ無作為に割り付け、7週間追跡した。時系列からアルゴリズムへ切り替えるとエンゲージメントが増え、政策の優先順位、トランプ前大統領への捜査の受け止め、ウクライナ戦争の見方において、態度が保守・共和党寄りへ動いた。逆方向の切り替え(アルゴリズム→時系列)に同等の効果はなかった。

内容分析は、アルゴリズムが保守系や活動家の投稿を多く見せ、既存の報道機関を降格させていたことを示した。さらに重いのは、どの利用者をフォローするかという選択にまで影響が及び、アルゴリズムを外した後も情報環境に痕跡が残った点である。効果は一過性の気分変動ではなく、持続し、可逆的でもなかった。研究対象はPhoenix登場前の、より弱く結合の緩いアルゴリズムである。だからこそ、同一プラットフォーム上の同じ目的関数(エンゲージメント最適化)が7週間で持続的な政治的変化を生んだ事実は、立証責任を反転させる。Phoenix固有の無作為化試験がなくとも、より強力な後継系が「悪化していない」ことを、比較可能な実験で示す責任はX側に移ったとみられる。

対策はループを断てるのか

Phoenixは素朴な「いいね最大化」装置ではない。「興味なし」・ブロック・ミュート・通報といった負の信号はスコアを強く押し下げ、利用者と一部ネットワークの双方で「二度と見せるな」と解釈される。著者と情報源の多様性スコアラーが同種の投稿の連続を抑え、candidate isolationが投稿ごとのスコアを安定させる。誤情報には、利用者が文脈を付すCommunity Notesが事後に貼られる。これらは実在し、一部の危険を確かに減らす。

ただし、いずれも露出の後に効く。投稿は既にタイムラインへ届いている。負の重みは悪用にも弱く、協調した集団が一斉にミュートや通報を行えば、安全装置のはずの仕組みが武器に転じる。多様性スコアラーは「利用者を留め続ける」という同じ目的関数の内側で味付けを変えるだけで、循環そのものは断たない。Community Notesは事後の貼り紙であり、Phoenixの学習パイプラインへ構造化された信号として戻るわけではない。2026年1月に手作業特徴量を全廃した結果、調整余地はモデルの内部へ移り、外からは一段見えにくくなった。「真実探究」という旗印を掲げても、その語が訓練データと損失関数のどこに具現化されるかを、X以外は確かめられない。対策は目的関数の内側の微調整にとどまり、訓練と配備に対する独立した拒否権という、設計の核には触れていない。

公開コードと統治の落差

「史上最も開かれたアルゴリズム」という売り文句には、巧妙な置き換えがある。開かれているのは、権力にとって最も重要でない部分である。公開リポジトリは推論コードとスコアラーの論理、小型版モデルの一式を与え、合成入力でスコアの動きを観察させる。だが生きた訓練パイプライン(データの抽出・選別・重み付け・更新頻度)も、実際の訓練データも、誰がどの審査でモデルを出荷し、どの引き金で巻き戻すのかという統治層も渡さない。コードの開示は、訓練と配備の共同統制を伴わなければ、てこのない透明性にとどまる。

統治の現実は欧州が先行する。欧州委員会はXを2023年4月25日にVLOP(超大規模オンラインプラットフォーム、EU月間4,500万人超)へ指定し、2024年7月12日にはダークパターン、広告の透明性、そして研究者へのデータ遮断をめぐりデジタルサービス法(DSA)第25・39・40条違反の予備的認定を通知した。2025年12月には同法で初の制裁金約1.2億ユーロ(約190億円)を科した。研究者のデータ接続を阻む行為が違反項目に含まれる事実は、本稿が問う「外部からの監査可能性」が制度上の争点に達したことを示す。

出来事	時期	内容・数値	出典
旧the-algorithm公開	2023年3月	人手指標を多用(Heavy Ranker等)	旧Twitter
Xの態度形成効果(RCT)	2023年夏/Nature2026	約5,000人・7週・保守寄りに持続	Gauthier et al.
xAIによるX買収	2025年3月28日	全株式交換、xAI 80B/X33B	CNBC
Phoenix公開	2026年1月20日	Grok-1派生・手作業特徴量全廃	xai-org/x-algorithm
DSA予備的認定	2024年7月12日	第25・39・40条、研究者データ遮断	欧州委員会
DSA初の制裁金	2025年12月	約1.2億ユーロ(約190億円)	欧州委員会

翻って、Xを世界2位の約7,090万人が使う日本には、対応する装置がない。2025年4月施行の情報流通プラットフォーム対処法は違法・有害情報の削除手続きの迅速化と透明化が主眼で、推薦アルゴリズムの監査や学習データの開示には踏み込んでいない。災害・交通・行政情報の確認を反射的にXへ依存する社会で、信念を形づくる系の中身を検証する公的な経路は、事実上ひらかれていない。

日本企業が直面する選択

機会の側から見れば、第一に、Xを主要接点とする企業のマーケティング戦略は、フィードが「中立な配信路」ではなく能動的に文脈を作り変える系だという前提に立て直す余地がある。Gauthier論文が示した既存報道機関の降格は、広報・IR情報の到達構造が静かに変わりうることを意味する。第二に、推薦システムやアルゴリズム監査を理解する人材を抱える企業は、欧州DSAのデータ接続義務が他地域へ波及する局面で、規制対応とリスク評価の先行者利益を取りやすい。

リスクは三つある。第一に、世界2位市場でありながら日本は推薦アルゴリズムを検証する制度を欠き、世論形成の系を外から確かめる経路が乏しい。第二に、Grokが投稿で学び、フィードで枠づけし、その反応で再学習する二重ループは、災害時の情報秩序や選挙期の言論環境という公共財を、私企業の閉じた目的関数に委ねる構造を抱える。第三に、対策の中心が目的関数の内側にある以上、外部の監査・公開ログ・拒否権が訓練と配備の輪へ直接組み込まれない限り、安全装置は露出の後追いにとどまる。Xが採った段階的開示は前進だが、権力の所在が採点式ではなく訓練と統治にある事実は変わらない。日本企業と規制当局に問われるのは、提案された各変更が「信念を静かに形づくる能力」を減らすのか増やすのか、その一点を測る目を持てるかだと見られる。