人とロボットの協調を導く 空間World Model技術とは

富士通は、2025年4月に「空間ロボティクス研究センター」を設立し、人とロボットが協調する新しい社会の実現に向けた研究を本格化させている。本研究センターの研究成果として2025年12月2日に発表されたのが「空間World Model技術」だ。人とロボットや、複数のロボット間の最適な協調動作を実現する本技術が可能にする、フィジカルAIの未来を見ていこう。

ビジョンAIから広がる研究

　AI研究の進展から、これまでのデジタル空間から現実空間に、AIを発展する動きが盛り上がりを見せている。その中でも注目を集めているのが、AIに物理法則を学習させ自律行動させるフィジカルAIだ。フィジカルAIは自動運転やスマートファクトリーなど、実空間のさまざまな課題を解決する手段として期待されている。

　富士通も、このフィジカルAIに関する研究を行っている企業の一つだ。同社はもともと、手のひら静脈認証や顔認証といった生体認証に加え、カメラによる行動分析や人物追跡といったビジョンAIに対する研究開発に取り組んできた。このビジョンAIの技術を軸にした次の研究フェーズとして現在取り組んでいるのが、フィジカルAIに関する研究だ。2025年4月には「空間ロボティクス研究センター」を発足し、人とロボットが協調する新しい社会の実現に向けた研究に取り組んでいるほか、AIロボット協会（AIRoA）にも参画し、共同研究にも取り組んでいる。

　富士通空間ロボティクス研究センターシニアリサーチディレクター安部登樹氏は、前述した研究センターでフィジカルAI実現に向けた研究に取り組んでいる。「当社はもともとビジョンAIによって、空間全体をセンシングすることに関しては高い技術があります。空間ロボティクスではその技術を用い、実世界の人やロボット、IoT機器も含めた空間全体を知能化（ロボット化）することで、実世界や空間の状況を先読みして働きかけを行うような技術を指し、現在研究を行っています」と安部氏は語る。

　その空間ロボティクスの中核技術として現在研究開発に取り組んでいるのが、「空間World Model技術」だ。近年、ロボティクス分野では周囲の環境の変化を想像するWorld Model（世界モデル）技術が注目を集めており、自律走行などのロボット制御に活用されている。一方、複数のロボットや人が相互に動作するような環境では、空間の構造や相手の行動、意図の把握が難しいという課題があり、十分にロボットを機能させることが難しい。その課題を解決するのが、空間World Model技術だ。

空間把握×未来予測で協調を導く

　空間World Model技術は、空間内の人、ロボット、モノの未来を想像し、複数のロボットを適応的に動作させる技術だ。本技術には「空間把握」と「未来予測」という二つの特長がある。

　まず空間把握だ。通常、人やロボットが移動すると空間の状況も動的に変化する。空間全体を把握するために、これまでは防犯カメラやロボットカメラが撮影した映像を統合する技術が検討されていたが、各カメラが捉える範囲や、固定型カメラや移動型カメラで撮影した映像の見た目に差異が発生するため、動的に変化する空間をリアルタイムに把握することは困難だった。そこで、見た目の差異の影響を受けやすい画素単位の統合ではなく、人やロボットといった物体（オブジェクト）をベースに空間カメラとロボットカメラを統合し、ゆがみなどの影響を抑えつつ、空間全体を把握できる技術を開発した。

　次に未来予測だ。人とロボットが協調するためには、相手の行動のみならず、行動の背景にある意図を推定し、未来の行動を見通すことが重要になる。それを実現するため、ロボットが周囲の変化を予測し、自身の行動を決めるWorld Model技術が研究されているが、目の前の環境しかモデル化できず、空間中の人やロボットの状況変化を捉えることは困難だった。

　そこで富士通は、空間における人やロボット、モノの3Dシーングラフの時系列データを活用することで、空間全体のWorld Modelを学習する方式を開発した。人、ロボット、モノ間の多様な相互作用性から、複数の行動主体が起こす次の行動を推定することで、対象の空間における未来の状態を予測する。空間内を時系列に予測することで、自律ロボット間の衝突回避や複数ロボット間での最適な協調動作プランの生成などを実現するという。

　これらの特長を組み合わせた空間World Model技術によって、従来困難とされていた人とロボットとの協調動作や、複数ロボット間での協調動作を実現できる。

「これらのフィジカルAIは通路が規定された製造現場や物流倉庫など、整備された環境での活用が中心です。一方、ロボット向けに整備された環境ではないオフィスや公共施設、商業施設などの環境では自律動作に課題があります。例えば海外の事例ですが、配送ロボットが歩行者と接触する事故の報告や、警察のテープで封鎖された犯罪現場を走行してしまったというインシデントが発生したことがありました。人であれば、進入禁止を示されたテープがあればそれより先に進行することはありませんが、ロボットの場合テープの存在は認識しても、そこに侵入してはいけないという判断ができず、犯罪現場を走行してしまうのです。当社では長年のビジョンAI研究の蓄積を生かし、このような複雑な現実世界の理解力を空間World Model技術によって向上させることで、フィジカルAI研究の発展を目指します」と安部氏。

空間World Model技術のデモの様子。上部に空間カメラが取り付けられ、四足歩行型の警備ロボットのカメラと共に空間を把握している。

監視区域内で侵入者が不審な物を置こうとすると、それを察知し、四足歩行型の警備ロボットが威嚇の動作を取る。

自律的に協調するロボットの可能性

　この空間World Model技術は、米国のラスベガスで開催されたCES2026にも出展され、来場者から大きな注目を集めた。

　安部氏は「フィジカルAIという観点ですと、中国にヒューマノイドロボットベンダーが非常に多く出展しており、洗濯物をたたむなどの手先の器用さや、ボクシングのようなダイナミックな動きがアピールされていました。その中で当社の空間World Model技術を活用した複数のロボットが協調して動作する当社のデモは、パイロットなしで自律的に動作するという点が高く評価されました」と語る。

　CES2026では、複数の空間カメラと犬型の警備ロボットに搭載されたカメラを組み合わせて空間を把握し、その場所に入ってきた人間の動作を未来予測するというデモンストレーションを行った。具体的には、警備を行う空間に人間が侵入してきた場合、そこに不審なものを置こうとしていないか、といった動作を未来予測し、その場から離れるよう四足歩行型のロボットが警戒の動作を行うほか、壁面のプロジェクター映像にその場から離れるよう警告を表示する。

　安部氏は「天井などに設置する空間カメラは必須ではありません。例えばロボットに搭載されているカメラの映像を複数台組み合わせることで、空間把握が可能になります。またドローンを使うことで、空間カメラが設置できない屋外でもこうしたロボットを活用した監視が行えるようになります」と語る。

　こうした空間World Model技術は、デモのようなフィジカルセキュリティや、工場のオートメーション化などニーズにマッチしている。加えて、ヘルスケアや町内の見守り、防犯などの用途など、これまでフィジカルAIの需要があった一方で、安全性の観点から導入が難しかったような現場にも適している。前述した通り、ドローンのカメラを空間カメラとして活用することもできるため、屋外の災害支援や、海底環境の資源探索などにも活用可能性が見込まれているのだ。

「空間World Model技術は現在研究段階です。当社は川崎にあるFujitsu Technology Parkの再開発プロジェクトに取り組んでおり、2026年中にそのフィールド内で警備ロボットを導入し、空間World Model技術の実証に取り組むことを検討しています」と安部氏は展望を語った。