ロボットは単一の製品ではなく、知覚・認知・駆動・動力の四層が積み重なる技術の連なりだ。LiDARや4Dレーダー、エッジAI半導体、波動歯車を使う関節、模擬空間での学習、そして人形・手術・物流・海中・防衛の応用までを、株式情報を排し検証済みの数値だけで体系的にたどる長編技術レポート。

ロボットの話題は、人のかたちをした完成機に集まりがちだ。歩く、掴む、運ぶという目に見える動きが注目を奪い、二足歩行の一体がぎこちなく階段を上る映像が、その季節の象徴になる。だが、その身体を成り立たせているのは、周囲を測るセンサー、判断するエッジAIの半導体、関節を回すモーターと減速機、そして全体を支える電池と放熱という、何層もの技術の積み重ねである。冒頭に並ぶ三十あまりの企業群は、銘柄の一覧というより、この積み重ねのどの位置を担うかを示すエコシステムの地図に近い。

ロボットがいま再び熱を帯びるのは、人工知能が画面の中の言葉や画像から、現実の物体を動かす段階へ踏み出したからだ。文章を生成する知能と、身体を制御する知能は、扱う対象は違っても、大量の試行から規則を学ぶという骨格を共有する。その学んだ知能を、転ばず、壊さず、現実の摩擦の中で働かせるには、半導体だけでも、モーターだけでも足りない。本稿は、ロボットを一つの製品としてではなく、検証済みの数値で裏づけられた技術の連なりとして分解し、各層の動作原理と、そこに陣取る担い手の現状と方向性を、長い射程で追う。

ロボットを成り立たせる四つの層

どんなロボットも、測り、考え、動かし、それを電力で支えるという四つの層で動く。最上段の用途がどれほど違っても、下に流れる構造は共通している。周囲の形や距離や力を数値に変える知覚、その数値から次の動きを決める認知と計画、決めた動きを関節の回転と力に変える駆動、そして全体に電気を供給して発熱を逃がす動力——この四層のどれが欠けても、ロボットは止まる。

ロボットを成り立たせる四つの層
ロボットを成り立たせる四つの層

上の層ほど目立ち、下の層ほど地味だが、競争の難しさはむしろ下に集まる。知覚のセンサーと駆動の減速機、動力の電池は、いずれも物理の制約と長年の擦り合わせがものを言う領域で、新規参入が容易ではない。半導体の演算性能は数字で比べやすく、進歩も速い。だが、薄い歯車を一回転で正確に二枚ぶんだけ進ませる機構や、原子数十個ぶんの薄さの膜で電荷を保つ電池は、設計図を真似ても同じ歩留まりは出ない。用途の華やかさではなく、各層をどれだけ精密に作れるかが、最後に残る担い手を選り分ける。

世界を測る目 — LiDAR・4Dレーダー・力覚

知覚の層では、ロボットは光・電波・画像・力という異なる物理量を使い分けて周囲を測る。光による測距(LiDAR)は、レーザーを当てて跳ね返るまでの時間から距離を割り出す。

光の速さは秒速およそ30万キロメートルだから、往復の時間を一兆分の一秒の精度で測れば、数センチの距離を刻める。

  • 波長905ナノメートルの光は安価な半導体検出器で受けられる一方、目への安全のため出力に上限があり到達距離が伸びにくい。
  • 波長1550ナノメートルは目に安全な範囲で出力を上げられ遠くまで届くが、受光素子に高価な化合物半導体が要る。この波長の選択が、距離と価格の設計を二つに分ける。
世界を測る四つの目
世界を測る四つの目

Ousterは単一光子すら捉える検出器(SPAD)をCMOSに集積し、回転する機械式から半導体式へと小型化と低価格化を進める(Ouster)。InnovizやMicroVisionは微小な鏡を振るMEMS方式で可動部を減らし、振動や寿命の弱点を抑えにいく。

電波を使う4Dレーダーは、光が苦手な霧や暗闇で力を発揮する。周波数を掃引した電波の反射から距離を、跳ね返りの周波数のずれ(ドップラー)から速度を読み、送受信の素子を組み合わせた仮想的な大きな開口で方位と高さまで測る。

距離・速度・方位・高さの四つを同時に得るから四次元と呼ばれる。Arbeの設計はその到達点の一つで、48基の送信と48基の受信から2,304もの仮想チャンネルを作り、方位1度・仰角1.7度の分解能で、290メートル先の11.5センチ角の小さな物体まで描き分ける(Arbe)。

これらが捉えにくい接触の瞬間を埋めるのが力覚だ。金属の薄い箔は、わずかに伸び縮みすると電気抵抗が変わる。この性質を使ったひずみゲージをブリッジ回路に組み、指先や手首にかかる力を電圧の変化として読み取る。Vishay Precisionが手がける力・荷重・ひずみの測定は、物を壊さずに掴むための触覚にあたり、卵を割らずに持ち、固いボルトには強く回すという力加減を、ロボットに与える。視覚で位置を合わせ、力覚で接触を制御するという役割の分担が、繊細な作業の成否を分ける。

別々の目を一つの世界像に束ねる

四つの目は、それぞれに死角を抱える。カメラは逆光や暗闇に弱く、LiDARは霧や雨で光が散り、レーダーは解像度が粗く、力覚は触れた瞬間しか語らない。一つのセンサーだけに頼れば、その弱点がそのままロボットの盲点になる。そこで欠かせないのが、複数のセンサーの出力を重ね合わせ、一つの首尾一貫した世界像へ束ねるセンサー融合だ。

束ねるには、まず時間と空間の物差しを揃える必要がある。各センサーは取り付け位置も計測の周期も違うため、どの瞬間のどの座標を指しているかを正確に対応づける較正が前提になる。その上で、それぞれの計測がどれだけ確からしいかを確率として扱い、矛盾する情報に重みをつけて一つの推定へまとめる。物体がどこにあり、どれだけの速さで動くかという推定を、観測のたびに更新していく手法が広く使われる。一台のセンサーが誤っても、他のセンサーが食い違いを指摘すれば、誤りを早く正せる。この多重性が、人と隣り合って働くロボットの安全を支える。工場の現場で、Cognexのマシンビジョンが部品の位置を、Zebraの読み取りが在庫の所在を確かめるように、種類の違う目を組み合わせて初めて、現実の雑然とした環境を取り違えずに捉えられる。融合の質は、つなぎ合わせるエッジAIの賢さに直結する。

見るから動かすへ — 感知・計画・駆動の輪

測った情報は、その場で判断に変えなければ意味をなさない。遠くのデータセンターへ送って返事を待つ余裕は、転びかけた身体の制御にはない。歩行の安定を保つ制御は、ふらつきを感じてから足を踏み替えるまで、コンマ数秒で完結させる必要がある。だからロボットは、感知・計画・駆動・手応えの確認という輪を、手元のエッジAIで毎秒何百回も回す。

感知・計画・駆動がぐるぐる回る
感知・計画・駆動がぐるぐる回る

この頭脳を供給する位置でNVIDIAが抜きん出ている。人形ロボット向けのJetson Thorは、Blackwell世代のGPUと14基のArmコアを一枚に積み、四ビット精度でおよそ2,070テラ演算に達する。メモリーは128ギガバイト、消費電力は40から130ワットで、前世代のOrinと比べてAI性能は7.5倍、電力効率は3.5倍に伸びた(NVIDIA)。電池で動く身体にとって、判断を速く、かつ電気を食わずに回せるかは死活の差で、この電力効率の改善がそのまま稼働時間に効く。

異なる方向から攻めるのが省電力勢だ。Ambarellaは画像処理に特化したSoCで運転支援の判断を担い、消費電力を抑えながら複数のカメラを同時に解析する。

  • Ambiqはトランジスタをあえて低い電圧で動かす技術で、マイクロワット級の超低消費電力を実現し、常時起きて周囲をうかがう小さなセンサーの頭脳に向く。
  • Latticeの低消費電力FPGAは、種類の違うセンサーの信号を束ねて整える橋渡しとして、待機時の電力を切り詰める。

頂点の演算性能を競うNVIDIAと、底辺の消費電力を競う省電力勢は、同じエッジAIという土俵の両端に立っている。

頭脳をどう育てるか — 模擬空間と基盤モデル

身体を動かす知能は、現実の中だけでは育てられない。本物のロボットを転ばせて学ばせれば、一回ごとに部品が壊れ、時間も費用も際限なくかかる。そこで主流になったのが、仮想の世界に物理を再現し、その中で何百万回も試行させてから、現実へ移すという手順だ。

頭脳をどう育てるか — 模擬空間と実機の往復
頭脳をどう育てるか — 模擬空間と実機の往復

仮想空間では、重力も摩擦も衝突も計算で再現され、ロボットは壊れることを恐れずに失敗を重ねられる。そこで得た膨大な試行から、動きの「常識」とでも呼ぶべき規則を、一つの基盤モデルに凝縮する。NVIDIAが人形ロボット向けに掲げるGR00Tは、その基盤モデルの試みで、仮想空間を提供するIsaacやOmniverseと組み合わせ、頭脳と学習の場を一体で差し出す(NVIDIA)。一つの脳で多くの作業をこなせれば、作業ごとにプログラムを書き直す手間が消える。

難所は、仮想と現実の差をどう埋めるかにある。計算で作った世界は滑らかすぎて、現実の床のわずかな凹凸や、関節の摩擦のばらつきを写しきれない。

  • この差を放置すれば、仮想で完璧に歩いたロボットが現実で転ぶ。実機で得た手応えを仮想へ持ち帰り、模擬の物理を現実へ近づけるという往復を回すことで、その溝を少しずつ詰める。
  • 演算の半導体と、仮想空間と、基盤モデルを一体で握る企業ほど、この往復を速く回せる。ロボットの賢さが、もはや機械の精度だけでなく、学習の基盤をどれだけ太く持つかに左右される時代に入った。

関節を回す力 — モーターと減速機

計画した動きは、最後に関節の回転と力へ変換される。ここで主役を演じるのが、ブラシレスモーターと減速機の組み合わせだ。モーターが生む力(トルク)は、流す電流と磁石の強さの積でほぼ決まる。だが小型で軽いモーターは速く回る代わりに力が弱く、そのままでは人を支える関節を動かせない。回転を遅くして力を増す減速機が、この弱さを補う。

関節を回す力 — モーターと減速機
関節を回す力 — モーターと減速機

人形ロボットの関節に多用されるのが波動歯車(ハーモニックドライブ)だ。波動発生器・フレックススプライン・サーキュラースプラインというわずか三つの部品からなり、薄い金属のカップをたわませて、外側の歯車とちょうど二枚だけ歯数を違える。すると一回転あたり歯数差ぶんしか進まず、単段で30対1から320対1という高い減速比を得る。歯車の遊びは噛み合いの隙間から生まれるが、波動歯車は常に全歯の約三割が同時に噛むため、その遊びがほぼ無い(機構学資料)。隙間のない正確な伝達は、繰り返し同じ位置へ手を運ぶ作業や、力を細かく制御する動きで効いてくる。エンコーダーが関節の角度を測って制御へ戻し、ずれを絶えず補正する。AllientやNovantaが手がける制御・駆動・エンコーダーは、この精度を底から支える部品群にあたる。減速比を上げるほど力は増すが応答は鈍る。その釣り合いをどこに置くかが、設計の勘どころになる。

一体に詰め込まれた五十の自由度

一体の人形ロボットには、この駆動部が数十か所も詰め込まれる。テスラのOptimusを例にとると、胴体と脚と腕は28個のアクチュエーターで動く。うち回転式の14個は、枠なしのトルクモーターに波動歯車とセンサーを組み合わせ、ねじり曲げる関節を担う。残る直線式の14個は、同じトルクモーターに遊星ローラーねじを組み合わせ、回転を押し伸ばす大きな力へ変える(Tesla)。膝で全身を支え、腕で重い箱を持ち上げる動きは、この二種類の駆動部の使い分けで生まれる。

一体に詰め込まれた五十の自由度
一体に詰め込まれた五十の自由度

手は別建てで、さらに細かな自由度を抱える。第2世代のOptimusの手は片手で11の自由度を持ち、指先に触覚を備えた。第3世代ではこれを片手22の自由度へ大きく増やし、人の手に近い器用さを狙う。胴体の28と両手を合わせると、全身でおよそ50を超える自由度が連動して動く計算になる。これだけの数の駆動部を、転ばない速さで協調させて制御するところに、人形ロボットの難しさが凝縮している。中国のXPengが公開した人形ロボットIRONや、小米(シャオミ)の機器も、この駆動部の数と密度をどう詰めるかという同じ問いに向き合っている。関節の一つひとつが、モーターと減速機とセンサーと制御の小さな塊であり、その塊の精度と価格が、一体の完成度と量産のしやすさを決める。

なぜいま人のかたちが現実味を帯びたか

人のかたちのロボットは、半世紀にわたって何度も期待され、そのたびに高すぎる費用と未熟な制御の前に退いてきた。それがいま現実味を帯びるのは、三つの流れが同じ時期に合流したからだ。

  • 第一に、電気自動車の量産が、強くて安いモーター、高密度の電池、効率の良い電力変換の部品を、世界規模で安価に供給する基盤を整えた。関節に使うトルクモーターも、電池を制御する半導体も、車載で鍛えられた量産品を転用できる。
  • 第二に、大量の試行から規則を学ぶ基盤モデルが、作業ごとに動きを書き下す手間を不要にし始めた。第三に、自動運転やスマートフォンの規模が、LiDARやカメラやMEMSのセンサーの価格を押し下げた。

部品が安くなり、頭脳が賢くなり、目が手に入る——人のかたちという難題を解くための材料が、ようやく同時に出そろった。電気自動車を作った供給網が、そのまま次に人形ロボットへ流れ込もうとしている。モーターと電池と半導体を量産する力を持つ陣営が、ロボットでも有利に立つという構図は、自動車産業の勢力図と重なって見える。難しさが消えたわけではないが、挑む側が手にする道具立ては、十年前とは別物になった。

人のかたちに挑む — 米中の二正面

完成機の中でも、人のかたちを目指す競争がいま最も熱い。テスラはOptimusを自社工場で立ち上げ、まず自社の作業に投じてから外販へ広げる道筋を描く。歩行と把持の実地投入を急ぐAgility Roboticsは、二足歩行ロボットDigitを量産するRoboFabという人形ロボット専用の工場を稼働させた。公称の生産能力は年1万台に達するが、実際の生産はまだそれを大きく下回り、量産の難しさを率直に映している(Agility)。現代自動車の傘下に入ったBoston Dynamicsは、長年の油圧式から電動式へ作り替えた新型のAtlasで商用化を探る。

米中の技術摩擦は半導体や製造装置に集中して語られがちだが、人形ロボットは部品の調達から制御の蓄積まで、両国が正面から競うもう一つの戦線になりつつある。

中国は電池とモーターと減速機の量産基盤を国内に厚く持ち、人形ロボットの部品を安く速く揃えられる強みを生かす。XPengのIRON、小米のロボット、そして低価格機を矢継ぎ早に出す新興勢が、価格と量産で攻める。

一方の米国勢は、学習の基盤モデルとエッジAIの半導体、そして高精度のセンサーで質を押し出す。短期の話題性で測れば各社の披露目は華やかだが、長期で残るのは、転ばずに働き続け、注文に見合う数を約束どおり納められる担い手だ。歩く映像の滑らかさと、工場の生産能力と、現場での故障の少なさは、別々に評価されなければならない。

手術室のロボット

医療では、ロボットがすでに日常の道具になっている。Intuitive Surgicalのダヴィンチは、主従式の遠隔操作で術者の手の動きを術具へ伝える。手の震えを電子的に取り除き、大きな手の動きを小さな動きへ縮小して、数ミリの世界での切開と縫合を可能にする。手首に相当する関節が七つの自由度で曲がり、人の手では届かない角度から針を運べる。2024年に投入した第5世代では、同社で初めて術具にかかる押し引きの力を術者の手元へ返す力覚を載せ、組織にかかる力を最大43%減らした。設置台数はダヴィンチ全体で2024年9月末に9,539台に達し、2025年には術中の力の大きさを目盛りで示す機能など、実時間の情報提示も加わった(Intuitive)。

これに各分野の専用機が続く。Strykerの整形外科向けMakoは、事前に撮影した三次元の計画に沿って、ロボットアームが切削できる範囲を物理的に制限し、健全な骨を削りすぎないよう術者の手を導く。PROCEPT BioRoboticsは前立腺肥大の治療で、熱を使わず水の噴流で組織を削るアクアブレーションを、内視鏡と超音波の誘導下で短時間に行う。熱を使わないため、周囲の神経を傷めにくいという利点が、機能温存を重んじる治療で支持を集める。Medtronicも軟部組織向けのHugoで臨床を進め、ダヴィンチの牙城に挑む。手術ロボットの価値は機械の精密さに加え、術者の習熟と症例の蓄積、そして器具を消耗品として売る長い関係に支えられ、そこが新規参入の高い壁になっている。一台を売って終わりではなく、術式ごとの器具とデータが積み上がるほど、後発が追いつきにくくなる。

工場で鍛えられた協働ロボット

人形ロボットが注目を集める一方で、ロボットが最も長く確実に働いてきた場所は工場だ。溶接や組み立てを担う産業用ロボットは、何十年も前から安全柵の中で、速く強く正確に同じ動きを繰り返してきた。ただし周囲を見ず、人が近づけば止めるしかなかった。その壁を崩したのが協働ロボットで、力を一定以下に制限し、人に触れれば即座に止まる設計により、柵を外して人の隣で働けるようにした。人と機械が同じ空間で安全に作業できる条件は、国際規格が力の上限や停止の応答として定めている。

この領域には、長年の運動制御の蓄積が厚く積もる。Teradyneは半導体の試験装置を本業としながら、協働ロボットのUniversal Robotsと、床を自走する搬送ロボットのMiRを傘下に持ち、工場の自動化へ深く食い込む。ABBやRockwell、Honeywellは、工場全体を動かす制御の系統を供給し、Lincoln Electricは溶接の自動化を、Kulicke & Soffaは半導体を組み立てる装置の自動化を担う。これらが積み上げてきた、関節を滑らかに止め、力を細かく加減し、故障を予知するという地味な技術は、そのまま人形ロボットの土台になる。柵の中の速い腕と、柵の外を自由に歩く人形の間を、人の隣で働く協働ロボットが橋渡しする。工場で証明された信頼性こそ、ロボットが現実の現場に根を張れるかを決める試金石になっている。

倉庫・歩道・海底・路上 — 場所が変える設計

人のかたちにこだわらないロボットは、すでに広く働いている。物流の現場では、Amazonが倉庫の中で棚そのものを運ぶロボットを大量に動かし、人が歩いて棚を探す代わりに、棚のほうを人のもとへ運ぶ。Symboticは商品の保管と仕分けを高速で組み替える系統を納め、注文に応じて荷を組み立てる作業を機械化する。最後の数百メートルを担うのが配送ロボットで、Serve Roboticsは歩道を自走する小型機で料理を届ける運用を広げている。歩道という、人と犬と自転車が入り乱れる予測しにくい環境こそ、知覚と判断の難所になる。

光も電波も届かない海の中では、別の物理が支配する。電波は水に吸われてすぐ減衰し、光も濁りで届かない。そこで主役になるのが音波で、Oceaneeringは高い水圧の下で点検や作業をこなす遠隔操作の水中ロボットを長年供給し、Kraken Roboticsは音波で海底を高い解像度で描く合成開口ソナーを手がける。陸上の自動運転に目を移せば、Auroraが2025年4月27日、ダラスとヒューストンの間で運転手のいない大型トラックの商用運行を始めた。公道で重量級トラックを無人で走らせた米国初の事例で、その後フォートワース〜エルパソやフェニックスへの延伸を計画する(Aurora)。Mobileyeは運転支援の半導体と地図で、量産車の自動運転を支える。防衛では、AeroVironmentの小型無人機やKratosの無人機が、人を危険にさらさずに偵察と打撃を担い、その背後にLockheed MartinやNorthrop Grummanといった大手が控える。働く場所が変わるたびに、求められる精度と速度と耐久性の重みづけが入れ替わり、同じ「ロボット」という言葉が、まるで違う機械を指すようになる。

動かし続ける電力と発熱

四層の最下段にある動力は、ロボットの行動時間を直接縛る。電池の容量が小さければ稼働は短く、重ければ動きが鈍る。人形ロボットが一日の作業をこなすには、軽くて多くの電気をためられる電池が要る。エネルギーの密度を上げる切り札として、液体の電解質を固体に置き換える全固体電池の開発が進む。固体電解質はリチウム金属の負極と組み合わせて高い密度を狙え、漏れず燃えにくいという安全上の利点も持つ。QuantumScapeの最初の量産品QSE-5は、エネルギー密度301ワット時毎キログラム(体積あたり844ワット時毎リットル)で、残量10%から80%までの充電を約12分でこなす(QuantumScape)。Solid Powerは硫化物系の電解質で、それぞれ量産の壁に挑む。固体電解質を薄く均一に作り、充放電の繰り返しに耐えさせる工程の難しさが、普及の時期を左右している。

電池と並んで侮れないのが発熱の処理だ。モーターも半導体も電池も、働けば必ず熱を出す。狭い筐体に部品を詰め込むほど熱は逃げ場を失い、温度が上がれば性能は抑えられ、寿命も縮む。最悪の場合、電池は熱の暴走に至り発火する。KULRが手がける電池の安全と熱の管理は、この暴走を抑え込む技術として、無人機や宇宙用途で需要を集める。高い密度の電池ほど、ためた多くのエネルギーが万一の発熱で一気に解き放たれる危うさを抱えるため、密度を追う競争と、安全に逃がす技術は、表裏で進まざるをえない。動力と発熱は、派手な機能の陰に隠れがちだが、ロボットがどれだけ長く確実に働けるかを最後に決める制約になっている。

応用領域で見る技術の担い手

人形、医療、物流、自動運転、海中、防衛——働く場所は違っても、どの領域も知覚・認知・駆動・動力の四層を共有する。違うのは、必要な精度・速度・耐久性の重みづけと、安全に対する許容度だ。手術は速さより確実さを、防衛は耐久性と自律性を、物流は反復への強さを、それぞれ重く見る。同じ力覚センサーでも、手術では生体組織を傷つけない繊細さが、倉庫では荷崩れに耐える頑丈さが求められる。

応用領域で見る技術の担い手
応用領域で見る技術の担い手

この地図を眺めると、賑わいの中心がどこにあるかと、利益が最後にどこへ落ちるかは別だと分かる。短期の評価は披露目の話題性に左右されるが、長期で残るのは、注文を受け、納め、現場で動かし続けられる担い手だ。物語の魅力ではなく、納入の実績がふるいになる。歩く映像が滑らかな会社と、関節の減速機を遊びなく量産できる会社と、電池を安全に高密度化できる会社は、必ずしも同じではない。冒頭の一覧を、上昇率の順位ではなく四層のどこを握るかという技術の地図として読み替えると、ロボットという潮流が一点の好機ではなく、長い裾野を持つ連なりであることが見えてくる。

この連なりは、すでに静かに動き始めている。倉庫の棚は人のもとへ歩み寄り、手術台の上では人の手の震えを消した器具が数ミリの縫合を結び、ダラスとヒューストンを結ぶ高速道路では運転席が空のトラックが荷を運ぶ。海底では音波が暗闇を描き、工場では人の隣で腕が動きを止める。これらは実験室の披露目ではなく、現場で起きている事実だ。次の十年で人のかたちの機械が現場に増えるとき、注目はやはり歩く姿に集まるだろう。だが、その一歩を支えているのは、波長を選んだセンサー、電力を切り詰めた半導体、遊びを消した減速機、暴走を抑えた電池という、ここで分解した知覚と演算と駆動と動力の、地道な精度の積み重ねである。物語の華やかさが先に走り、技術の裏づけが後から問われる——ロボットという連なりを読むとき、目を凝らすべきは中心の賑わいではなく、その身体の奥で確実さを担う各層の担い手のほうだ。