フィジカルAI元年2026 ── ロボティクス再加速の構造的要因

はじめに ── 「考えるAI」から「動くAI」へ

2024年から2026年にかけて、AI産業の重心が大きく移動している。大規模言語モデル（LLM）がテキスト生成AIとしての地位を確立する一方で、次の投資フロンティアは「物理世界で行動するAI」── すなわちフィジカルAIに移行した。

NVIDIAのジェンスン・フアンCEOが2024年のGTC基調講演で「Physical AIの時代が来た」と宣言し、2025年のロボティクススタートアップへの投資額は過去最高の85億ドル（前年比2倍）に到達した。Google DeepMind、Boston Dynamics、Figure AI、Physical Intelligence、Tesla──テクノロジー企業が一斉にロボティクスへ参入あるいは再注力している。

本稿では、なぜ2026年がフィジカルAI「元年」と呼べるのか、市場データ・技術トレンド・実配備事例・投資動向の4軸で構造的に分析する。ロボティクスの「冬の時代」を経て、今なぜ再加速が起きているのか。その構造的な理由を一次情報に基づいて解説する。

1. 市場基盤 ── 産業ロボットの稼働台数が466万台に到達

国際ロボット連盟（IFR）が2025年9月に発表したWorld Robotics 2025によれば、2024年の産業ロボット新規設置台数は542,000台に達した。これは4年連続で50万台を超える水準であり、過去10年間で年間設置ペースがほぼ倍増したことを意味する。世界で稼働中の産業ロボット総数は4,664,000台（前年比プラス9パーセント）に達し、過去最高を更新した。

地域別の内訳を見ると、アジアが新規導入台数の74パーセントを占める圧倒的なシェアを持つ。とりわけ中国は単独で295,000台（全体の54パーセント）を設置し、世界需要の過半を占める。中国国内メーカーのシェアは過去10年で28パーセントから57パーセントへと倍増しており、2024年には稼働台数が200万台の大台を突破した。欧州は16パーセント、アメリカ大陸は9パーセントで続く。

IFRは2028年までに年間導入台数が700,000台に達すると予測している。この予測が示すのは、産業ロボットがもはや「検証段階」や「先進的な取り組み」ではなく、工場のデフォルトインフラになったという構造的変化だ。ロボティクスAIの研究成果を受け入れる「実装先」が、かつてないスケールで存在している。この市場基盤の厚みこそが、今回のフィジカルAI再加速が過去のロボティクスブームと本質的に異なる点である。

2. VLAモデル ── AIが「見て、理解して、動く」時代

フィジカルAI再加速の技術的起爆剤となったのが、VLA（Vision-Language-Action）モデルの急速な進化である。従来のロボット制御は、タスクごとに個別のアルゴリズムを手作業で設計する必要があった。「ボルトを締める」「箱を持ち上げる」「ドアを開ける」──各動作に対して、環境条件やオブジェクトの種類に応じたルールベースのプログラムが必要だった。VLAモデルはこのパラダイムを根本から変える。カメラ映像（Vision）と自然言語の指示（Language）を統合的に理解し、ロボットの行動制御コマンド（Action）に直接変換する。

Google DeepMindが2023年7月に発表したRT-2は、このVLAアプローチの先駆けとなった。ウェブスケールのデータで事前学習した視覚言語モデル（VLM）をロボット行動に接続し、「赤い缶をゴミ箱に入れて」という自然言語の指示からロボットアームの動作シーケンスを直接生成することに成功した。学習していない物体に対しても汎化能力を示し、言語理解を行動制御へ接続する方向性を決定づけた。

2.1 Google DeepMind Gemini Robotics

2025年3月、Google DeepMindはGemini 2.0をベースとした次世代VLAモデル「Gemini Robotics」を発表した。視覚理解・言語理解・運動制御を一つの基盤モデルで統合的に実現する。2025年7月にはロボット本体上で直接実行可能なGemini Robotics On-Deviceを公開。このオンデバイス版は最小限の計算リソースで動作し、わずか50回から100回のデモンストレーションで未知のタスクに適応できることを実証した。2025年10月のGemini Robotics 1.5では、行動決定前の推論プロセスを可視化する機能が追加され、ロボットが「なぜその動作を選択したか」を人間が検証可能になった。

CES 2026では、Boston DynamicsとGoogle DeepMindの戦略的提携が正式に発表され、Gemini Roboticsを電動Atlasに統合する方針が明らかになった。この提携についてはBoston Dynamics×Google DeepMind提携の技術的意味で詳細に分析しているが、VLAモデルがラボの実験段階から産業実装フェーズへ移行する象徴的な転換点と言える。

2.2 Physical Intelligence π0

2024年に設立されたスタートアップPhysical Intelligenceは、設立からわずか1年で累計11億ドルを調達した（2025年11月の6億ドル調達時点で評価額56億ドル）。同社のVLAモデルπ0は、フロー/拡散（flow/diffusion）ベースのアーキテクチャを採用し、最大50Hzの制御周波数で連続的なロボット動作を生成する。π0.5、π0.6と急速にバージョンアップが進み、強化学習（RL）によるファインチューニングを組み合わせることで、自律清掃タスクやRobot Olympicsベンチマークでの成功を収めている。

2.3 NVIDIA GR00T N1

NVIDIAのGR00Tプラットフォームは、ヒューマノイドロボット向けのオープンソース基盤モデルとして設計された。2025年にリリースされたGR00T N1は、完全にカスタマイズ可能な初のオープンVLAモデルとして業界の注目を集めた。特筆すべきは合成データ生成の効率で、Newton物理エンジン（Google DeepMindと共同開発のオープンソースプロジェクト）を活用し、11時間で780,000のシミュレーション軌道を生成できる。これは人間がデモンストレーションで同等のデータを収集した場合の約6,500時間分（約9ヶ月分）に相当する。シミュレーションから実機への転移学習（Sim-to-Real Transfer）のギャップを縮小する技術として、産業実装の加速に大きく貢献している。

3. ヒューマノイド ── プロトタイプから実運用配備へ

2026年のフィジカルAI領域で最も劇的な変化は、ヒューマノイドロボットが「技術デモンストレーション段階」から「工場での実運用配備」へ確実に移行したことだ。ヒューマノイド産業配備の転換点でも詳述した通り、複数の企業が同時に量産型ヒューマノイドの工場配備を開始している。

3.1 Boston Dynamics 電動Atlas

CES 2026で量産対応の電動Atlasが正式発表された。56自由度、110ポンド（約50キログラム）の積載能力、4時間の連続稼働（バッテリーホットスワップは3分で完了）という仕様は、産業現場での実用性を明確に意識した設計だ。グリッパーは3本指プラス対向親指の4指構成で、工場部品のハンドリングに最適化されている。1台あたりの価格は約42万ドル（約6,300万円）。2026年に生産される全ユニットはHyundai RMAC（ロボティクス・モビリティ・オートメーションセンター）とGoogle DeepMindに全数確約済みだ。

Hyundaiは2028年までに年間30,000台のAtlas製造能力を構築する方針を発表している。2028年にHyundaiジョージア工場（メタプラント）での部品シーケンシング業務に投入し、2030年には自動車組立ラインへの本格投入を計画している。電動Atlasの技術仕様と産業配備計画については別稿で詳しく解説している。

3.2 Tesla Optimus

Tesla Optimusプログラムは2025年に社内利用で5,000台の生産目標を掲げた。2026年第2四半期にはフリーモント工場の一部をOptimus製造用に転用する計画を発表し、年間100万台規模の製造キャパシティ構築に着手している。Optimus V3は2026年第1四半期の公開を目標としており、「ロボットというより、ロボットスーツを着た人間のように見える」レベルの自然な動作を実現するとされる。外部顧客への最初の商業販売は2026年後半、コンシューマー向け一般販売は2027年末を予定している。

3.3 Agility Robotics Digit

Agility RoboticsのDigitは、2025年11月にGXO Logistics施設（ジョージア州）で累計10万トートの搬送マイルストーンを達成した。これは商業環境でヒューマノイドが継続的に稼働し、測定可能な成果を上げた業界初の実績データである。トート（物流用コンテナ）のピッキング、コンベアへの積載、コンテナの段積みといった実際の物流業務をライブワークフロー内で遂行した。2025年4月のシリーズC資金調達では4億ドル（評価額17.5億ドル）を獲得。2024年に開設した世界初のヒューマノイド量産工場「RoboFab」での生産を拡大し、Mercado Libreとの提携によるラテンアメリカ展開も進行中だ。

3.4 Figure AIとApptronik

Figure AIはシリーズCで10億ドル超を調達し、企業評価額は390億ドルを超えた。2025年2月に発表した独自VLAモデル「Helix」は、汎用ヒューマノイド向けのジェネラリストVLAとして設計されている。BMWおよびJabilとの工場パイロットが進行中で、最終的に10万台規模の生産を計画している。

Apptronikは2026年2月のシリーズA延長ラウンドで5.2億ドルを調達し、設立からの累計調達額は10億ドルを超えた。同社のヒューマノイド「Apollo」は、2025年3月からMercedes工場でのパイロット運用を開始し、Jabilとの製造パートナーシップも締結している。2026年中の商業生産本格開始を目指す。

4. 投資マネーの集中 ── 過去最高の資金流入

2025年のロボティクススタートアップへのベンチャー投資総額は85億ドルで、過去最高を記録した（前年比約2倍）。この資金集中の背景には、LLMへの投資が一巡し、「次のフロンティア」としてフィジカルAIが機関投資家に位置づけられたという構造的要因がある。

企業	調達額	評価額	時期
Figure AI	10億ドル超	390億ドル超	2025〜2026年
Physical Intelligence	6億ドル	56億ドル	2025年11月
Apptronik	5.2億ドル	非公開	2026年2月
Agility Robotics	4億ドル	17.5億ドル	2025年4月

注目すべきは、上位調達企業がいずれも「汎用ヒューマノイド」または「汎用ロボット基盤モデル」を志向している点だ。特定の産業タスクに特化した従来型ロボットではなく、VLAモデルを搭載した汎用プラットフォームへ投資が集中している。これはLLM領域で起きた「汎用基盤モデルが特化型を凌駕する」というパターンが、ロボティクスでも再現されるという投資家の仮説を反映している。

ロボティクス市場全体の規模も拡大を続けている。グローバルなロボティクス市場は2024年時点で約900億ドル規模に達しており、2030年には2,000億ドルに到達するとの予測（GlobalData）もある。AI搭載ロボティクスに限定したセグメントでも、2025年の250億ドルから2031年には518億ドルへの成長が見込まれている。

5. 実装論 ── 競争軸は「モデル精度」から「運用設計」へ

筆者はJDLA認定講座の講師としてAI実装の教育に携わり、また自社でAIプロダクトの開発・運用を10年以上行ってきた経験がある。その中で一貫して痛感しているのは、技術のブレークスルーと現場での継続的な実装の間には、常に想像以上に大きなギャップが存在するということだ。フィジカルAIも例外ではない。VLAモデルの精度がどれほど向上しても、24時間365日の工場稼働を実現するには、モデルの外側にある運用設計が決定的に重要になる。

次の競争軸は以下の4つの領域に集約される。

5.1 連続稼働と停止復帰

Boston Dynamics Atlasのバッテリー持続時間は4時間。24時間の連続稼働を実現するには、最低でも6台のローテーション体制とホットスワップの運用フローが必要だ。さらに重要なのは、ロボットが異常停止した際の復帰手順である。「作業のどの段階で停止したか」「中断された作業をどの状態から再開するか」「再開前に安全確認が必要か」──これらはVLAモデルの学習データには含まれない、純粋な運用設計の領域であり、各導入企業が個別に構築する必要がある。

5.2 安全監査と法的フレームワーク

人間と同じ作業空間で自律的に動くヒューマノイドには、従来の産業ロボット安全規格（安全柵で囲って人間から隔離するISO 10218）とは根本的に異なる安全基準が求められる。協働ロボット向けのISO/TS 15066は存在するが、60キログラム超の重量で人間と同じ空間を自律移動するヒューマノイドをカバーするには不十分だ。新しい安全フレームワークの国際的な策定が、業界全体の課題となっている。

5.3 保守体制とTCO（総保有コスト）

Atlas 1台42万ドルの初期コストに加え、保守・修理・ソフトウェアアップデート・部品交換を含む総保有コスト（TCO）が導入企業の投資判断を大きく左右する。現時点では、ヒューマノイドロボットの長期運用コストに関する公開データはほとんど存在しない。Agility RoboticsがGXOでの10万トート搬送実績を公開した意義は、商業環境でのヒューマノイド運用コストの実データが初めて蓄積され始めたことにある。このデータが業界標準のTCOベンチマークとなり、他社の導入判断に影響を与える可能性が高い。

5.4 データフライホイールの構築

VLAモデルの真の競争優位は、実運用環境で蓄積されるデータにある。ロボットが工場で稼働するたびに収集される行動ログ・失敗事例・環境変動データが、モデルの継続的な改善に直結するからだ。NVIDIAがGR00Tで11時間あたり780,000のシミュレーション軌道を生成できることは強力だが、シミュレーションデータだけでは実環境の複雑さを完全には再現できない。合成データと実環境データを組み合わせたデータフライホイールを最初に確立した企業が、モデル性能の継続的改善において長期的な競争優位を獲得する。これはLLM領域でOpenAIがChatGPTのユーザーフィードバックで優位を築いたのと同じ構造だ。

6. 日本市場への示唆

日本はファナック、安川電機、川崎重工業、デンソーウェーブなど、産業ロボットの世界的メーカーを擁する「ロボット大国」だ。しかし、VLAモデルを核とするフィジカルAIの新しい波は、ハードウェアの精度や信頼性だけでは勝てない新たな競争軸を生み出している。

日本企業にとっての戦略的選択肢は3つある。第一に、NVIDIA GR00TやGoogle DeepMind Gemini Roboticsといったオープンな基盤モデルを自社ハードウェアに統合する「プラットフォーム活用型」。第二に、自動車組立・半導体製造・食品加工といった特定産業ドメインに特化したVLAモデルの独自開発。第三に、安全規格策定・保守体制構築・運用設計コンサルティングといった「モデル以外の競争領域」での差別化だ。

国立社会保障・人口問題研究所の推計によれば、日本の労働力人口は2040年までに約1,100万人減少する。この人口動態を考慮すれば、ヒューマノイドの産業導入は「あれば便利」な技術ではなく、「なければ産業が成立しない」レベルの構造的必然と言える。

7. 2026年以降のロードマップ

各社の公表計画を時系列で整理すると、フィジカルAIの産業実装は以下のスケジュールで進行する。

時期	マイルストーン
2026年	Atlas量産開始（Hyundai/DeepMind向け全数確約）、Optimus V3公開、Apptronik Apollo商業生産開始
2027年	Tesla Optimusコンシューマー販売開始、Agility Digit中南米展開（Mercado Libre提携）
2028年	Atlas年間30,000台製造体制確立、Hyundaiジョージア工場での部品シーケンシング本格稼働
2030年	Atlas自動車組立ライン投入、ロボティクス市場2,000億ドル規模到達予測

IFRは産業ロボット全体の年間導入台数が2028年までに700,000台に達すると予測しており、そのうちヒューマノイドの比率は2030年時点で5パーセントから10パーセントに達する可能性がある。年間35,000台から70,000台のヒューマノイドが工場に導入される計算であり、自動車産業と物流産業が最初の大規模導入セクターとなるだろう。

まとめ ── なぜ2026年が「元年」なのか

2026年をフィジカルAI「元年」と位置づける根拠は、3つの構造的変化が同時に発生したことにある。

第一に、市場基盤の成熟だ。産業ロボットの世界稼働台数466万台、年間導入54万台という規模は、VLAモデルの成果を受け入れる「実装先」が十分に存在することを証明している。

第二に、VLAモデルの実用化である。Gemini Robotics、π0、GR00T N1が2025年に相次いでリリースされ、50回から100回のデモンストレーションで新タスクに適応可能な汎用ロボット制御が技術的に実現した。

第三に、資金と実配備の収束だ。過去最高の85億ドルが投資として流入し、Atlas・Digit・Optimusが同時期に工場配備を開始した。「研究論文での成果」と「工場での実稼働」の間のギャップが、ついに埋まり始めた。

「考えるAI」から「動くAI」への転換は、AIが初めて物理世界に直接的かつ測定可能な経済価値を生み出す段階に入ったことを意味する。この転換の帰結は、工場の自動化効率にとどまらず、労働市場の構造・安全規制のあり方・国際的な産業競争力のバランスそのものを変えていくだろう。

よくある質問（FAQ）

Q1. フィジカルAIとは何ですか？

フィジカルAIとは、AIが物理世界で自律的に行動する技術の総称です。従来のAI（テキスト生成、画像認識等）がデジタル空間に閉じていたのに対し、フィジカルAIはロボットの身体を通じて現実世界に直接作用します。VLA（Vision-Language-Action）モデルにより、カメラ映像と自然言語の指示からロボットの動作を直接生成できるようになりました。NVIDIAのジェンスン・フアンCEOが2024年に「Physical AIの時代が来た」と宣言したことで、業界全体の注目を集めています。

Q2. VLAモデルとは何ですか？従来のロボット制御と何が違いますか？

VLA（Vision-Language-Action）モデルは、視覚入力（カメラ映像）・言語理解（自然言語の指示）・行動生成（ロボットの動作コマンド）を一つの基盤モデルで統合的に処理する新しいアプローチです。従来はタスクごとに個別のプログラムを手作業で設計する必要がありましたが、VLAモデルは「このボルトを締めて」という自然言語指示から直接動作シーケンスを生成できます。代表的なモデルにGoogle DeepMindのGemini Robotics、Physical Intelligenceのπ0、NVIDIAのGR00T N1があります。

Q3. ヒューマノイドロボットは本当に工場で使われ始めていますか？

はい、2025年後半から実運用が始まっています。最も具体的な実績として、Agility RoboticsのDigitが2025年11月にGXO Logistics倉庫（ジョージア州）で累計10万トートの搬送を達成しました。これは商業環境でヒューマノイドが継続的に稼働した初の測定可能な実績です。2026年にはBoston Dynamics AtlasがHyundai工場に、Figure AIがBMW・Jabil工場にそれぞれ配備されています。

Q4. ヒューマノイドロボット1台の価格はどのくらいですか？

Boston Dynamics電動Atlasは1台あたり約42万ドル（約6,300万円）です。Tesla Optimusは量産段階で2万ドルから3万ドル程度を最終的な目標価格としていますが、初期の商業販売価格は未公表です。Agility Digit、Figure、Apptronik Apolloも正式な小売価格は公開していません。導入判断にあたっては、初期コストだけでなく保守・修理・ソフトウェアアップデートを含む総保有コスト（TCO）で評価する必要があります。

Q5. フィジカルAIは日本の雇用にどのような影響を与えますか？

日本は2040年までに労働力人口が約1,100万人減少する見込み（国立社会保障・人口問題研究所推計）であり、フィジカルAIは労働力不足に対する構造的な解決策として期待されています。製造業・物流・介護など、人手不足が特に深刻な領域での導入が優先される見込みです。既存の雇用を置き換えるというよりも、人間が担えなくなりつつある業務を補完・代替する形での普及が主要なシナリオと考えられています。

Q6. NVIDIAはフィジカルAI領域でどのような役割を果たしていますか？

NVIDIAはGR00Tヒューマノイド基盤モデル、Isaac Simシミュレーション環境、Omniverse 3D開発プラットフォーム、Newton物理エンジンを提供し、フィジカルAIのインフラストラクチャ層を包括的に構築しています。特にGR00Tの合成データ生成能力（11時間で780,000シミュレーション軌道を生成、人間デモ約9ヶ月分に相当）は、実機データの不足という業界共通の課題に対する有力な解決策として注目されています。

Q7. フィジカルAIへの投資は過熱気味ではありませんか？

2025年のロボティクス投資額85億ドルは確かに過去最高ですが、LLM領域への投資規模（年間数百億ドル規模）と比較すると相対的に小さく、物理世界の対象市場規模（製造業だけで全世界GDPの約16パーセント）を考慮すればまだ初期段階と言えます。ただし、Figure AIの390億ドル評価額のように、現時点の売上規模に対して過大な評価が付いている企業も存在し、2027年から2028年にかけて実運用の成果が具体的な数字で問われる局面が来るでしょう。

参考

IFR, World Robotics 2025, https://ifr.org/ifr-press-releases/news/global-robot-demand-in-factories-doubles-over-10-years
Google DeepMind, "Gemini Robotics", https://deepmind.google/models/gemini-robotics/
Google DeepMind, "RT-2: New model translates vision and language into action", https://deepmind.google/discover/blog/rt-2-new-model-translates-vision-and-language-into-action/
NVIDIA, "Isaac GR00T N1", https://nvidianews.nvidia.com/news/nvidia-isaac-gr00t-n1-open-humanoid-robot-foundation-model-simulation-frameworks
Boston Dynamics, "Atlas 2026 Production", https://bostondynamics.com/blog/boston-dynamics-unveils-new-atlas-robot-to-revolutionize-industry/
Agility Robotics, "Digit 100K Tote Milestone", https://roboticsandautomationnews.com/2025/11/24/agility-robotics-digit-humanoid-passes-100000-tote-milestone-in-live-gxo-implementation/96877/
Apptronik, "$520M Funding", https://siliconangle.com/2026/02/11/apptronik-raises-520m-ramp-humanoid-apollo-robot-commercial-deployments/
Physical Intelligence, "$600M Raise", https://www.therobotreport.com/physical-intelligence-raises-600m-advance-robot-foundation-models/

フィジカルAI元年: なぜ今ロボティクスが再加速しているのか（2026年版）