World Labs Marble 空間知能の実用化とFei-Fei Liの3D世界生成AI

World Labsとは何か ── Fei-Fei Liが挑む「空間知能」革命

2024年1月、スタンフォード大学の計算機科学者であり「AIのゴッドマザー」と称されるFei-Fei Liが、World Labsを創業した。共同創業者には、Facebook AI Research出身のJustin Johnson、グラフィックス・レンダリング専門家のChristoph Lassner、空間推論の研究者Ben Mildenhallが名を連ねる。2024年9月にはAndreessen Horowitz（a16z）とNEA（New Enterprise Associates）の共同リードで2億3,000万ドルの資金調達を完了し、ポストマネーバリュエーションは10億ドルに達した。NVIDIAのベンチャー部門NVentures、Adobe Ventures、Databricks Venturesに加え、Google DeepMindチーフサイエンティストのJeff Dean、ジェフリー・ヒントンらもエンジェル投資家として参画している。

Fei-Fei Liが掲げる「空間知能（Spatial Intelligence）」とは、3次元環境を知覚し、推論し、その中で行動するAIの基盤能力を指す。現行のLLMが量子物理学を説明できても写真の中の物体間距離を推定できないように、既存AIには空間理解の根本的な欠落がある。Liは自身のSubstackエッセイ "From Words to Worlds" で「現在のAIは闇の中の言葉の職人──雄弁だが未経験、知識豊富だが根拠なき存在」と表現した。World Labsはこの空間知能のギャップを埋めるために設立された企業である。

Marble ── テキストから永続的3D世界を生成するマルチモーダルモデル

2025年11月12日、World Labsは初の商用製品「Marble」を公開した。Marbleは、テキストプロンプト、単一画像、複数画像、動画、360度パノラマ、粗い3Dレイアウトといった多様な入力から、永続的かつ探索可能な3D環境を生成するマルチモーダル世界モデルである。

従来のSoraやRunwayに代表される動画生成AIがフレームごとのピクセル列を出力するのに対し、Marbleは根本的に異なるアプローチを採用している。その基盤技術はGaussian Splatting──数百万個の半透明パーティクルで3Dボリュームを表現する手法である。これにより生成された環境は、視点を変えても幾何学的一貫性を維持し、永続的に探索可能な状態を保つ。映像の「再生」ではなく、3D空間の「構築」を実現している点がMarbleの本質的な差別化要因である。

特筆すべきは、AIネイティブな3Dエディタ「Chisel」の存在である。Chiselは構造とスタイルを分離する設計思想を持つ。ユーザーが粗い空間レイアウトを「彫刻」し、AIがテキストプロンプトに基づいて視覚的ディテールを充填する。この構造は、HTMLで骨格を定義しCSSで装飾するWeb開発の分離原則と構造的に類似している。反復的な編集とシーンの合成が可能であり、クリエイティブワークフローにおける実用性を大幅に高めている。

出力形式もGaussianスプラット（最高忠実度、オープンソースレンダラーSparkで描画）、トライアングルメッシュ（物理コライダー付き）、ピクセル精度のカメラ制御による動画と多岐にわたり、Unity/Unreal/VRプラットフォームとの互換性を備える。料金体系は無料プラン（4生成）からMaxプラン（月額95ドル・75生成）まで4段階で提供されている。

World API ── 空間知能のプログラマブル化

2026年1月21日、World LabsはWorld APIを一般公開した。これはMarbleの世界生成能力をREST APIとして開発者に提供するもので、Python/JavaScript SDKを通じてアクセスできる。テキスト、画像、パノラマ、マルチビュー入力、動画からナビゲーション可能な3D環境をオンデマンドで生成し、レイアウト、深度、照明、空間構造を保持した世界をアプリケーションに直接埋め込むことが可能となった。

このAPIが持つ意味は、3D環境生成を「プログラム可能な関数」として抽象化したことにある。従来、3D環境の構築には3Dモデラー、テクスチャアーティスト、ライティングデザイナーの専門チームが必要だった。World APIはその工程をAPI呼び出し一つに圧縮する。主要ユースケースとして、ゲーム・没入型メディア（2Dコンテンツの3D空間化）、ロボティクス・シミュレーション（物理的に妥当な訓練環境の高速生成）、建築・デザイン（スケッチからの探索可能空間生成）が挙げられている。

筆者自身、衛星画像からの建物検知AIや3D空間を扱うアプリケーションの開発に携わった経験がある。そこで痛感したのは、空間データ処理においては精度だけでなく「処理速度とコストのバランス」が実用化の鍵だということである。World APIのアプローチは、高精度な3D生成をクラウドAPI化することで、このボトルネックを根本から解消する可能性を持っている。

LWMの技術的位置づけ ── 言語モデルから世界モデルへ

World Labsが推進するLarge World Model（LWM）は、テキスト・画像・音声・センサー信号・動画・インタラクティブ環境を統合処理する新たなAIモデルクラスである。従来のLLMやビジョンモデルが1次元・2次元のトークン列を処理するのに対し、LWMは3次元・4次元（時間を含む）認識アーキテクチャで設計される。

技術的な差異は本質的である。LLMが言語パターンの統計的マッチングで機能するのに対し、LWMは空間的関係性（物体間の距離・遮蔽・配置）、動的推論（物体・空間・システムの時間的変化）、物理法則（重力・運動量・衝突・因果関係）の理解を目指す。現在の最先端マルチモーダルAIが「物体間の距離推定・向き・サイズの認識において、偶然の確率と大差ない」とされる現状に対し、LWMはこれらを構造的に解決しようとするものである。

Marbleの具体的な実装としては、Gaussianスプラットベースのレンダリング、2D・テキスト入力からの3D空間へのマルチモーダルリフティング、反復的精緻化を可能にするアーキテクチャが開示されている。ただし、World Labsは詳細なアーキテクチャ論文を未公開としており、技術的なコア部分はプロプライエタリである点は留意が必要だ。

LLMを活用したメディア運営を通じて実感することだが、AIのパラダイムシフトにおいて最も重要なのは「何ができるようになったか」ではなく「何の前提が変わったか」である。LWMが変える前提とは、「AIが3D空間を理解できない」という制約の解消であり、これはロボティクスから都市計画まで、空間情報を扱うあらゆる産業の基盤条件を書き換える可能性を持つ。

50億ドル評価の意味 ── 競争環境と資本の流れ

2026年1月23日、Bloombergは World Labsが50億ドルのバリュエーションで資金調達交渉中であると報じた。調達額は約5億ドルとされ、2024年9月の10億ドル評価からわずか16か月で5倍の企業価値上昇を示す。この評価額は、空間知能・世界モデルという領域に対する投資家の確信を如実に表している。

2026年初頭の時点で、世界モデル関連スタートアップに13億ドル以上の資金が流入している。競合環境も急速に形成されつつある。Google DeepMindの「Project Genie 3」は720p・24FPSのリアルタイムインタラクティブ3D世界を生成し、ブラウザベースでのユーザー入力駆動型体験を提供する。OpenAIのSora 2は物理法則準拠を強化した動画生成で、一人称視点のインタラクティブアドベンチャーを志向している。Yann LeCunが率いるAMI Labsは30億ユーロ評価での5億ユーロ調達を模索し、世界理解のための基盤モデルをヨーロッパから構築しようとしている。

World Labsの差別化ポイントは、「永続的な3D環境」の生成と編集に特化している点にある。Google Genie 3がリアルタイムインタラクティビティに、Sora 2がストーリーテリングと物理準拠に注力する中、World Labsは「プロフェッショナルなコンテンツ制作のための空間知能プラットフォーム」という明確なポジションを構築している。Chiselエディタによる構造とスタイルの分離、そしてWorld APIによるプログラマブルアクセスは、このポジションを技術的に支える基盤となっている。

10年以上にわたる起業経験から言えるのは、5倍の評価上昇が意味するのは「技術の成功」ではなく「市場の存在証明」である。投資家が50億ドルを正当化するには、技術が実用的な収益を生む道筋が見えている必要がある。World APIの公開は、まさにその道筋を具体的に示した動きといえる。

空間知能が産業にもたらすインパクト

World Labsの取り組みが示唆するのは、AI産業の重心が「言語理解」から「世界理解」へ移行しつつあるという構造的変化である。言語モデルの次のフロンティアとして、3次元空間の知覚・推論・生成を統合的に扱うLWMが台頭しつつある。

短期的には、ゲーム・映像制作・建築ビジュアライゼーションにおける3D環境構築コストの劇的な低下が見込まれる。中期的には、ロボティクスにおけるシミュレーション環境の自動生成が、実世界展開のボトルネックを解消する可能性がある。長期的には、空間知能を備えたAIが都市計画、災害シミュレーション、科学的発見において人間の空間認知を拡張する未来が展望される。

ただし、慎重な視点も必要である。World Labsは詳細なアーキテクチャを論文として公開しておらず、技術的な検証可能性は限定的である。また、50億ドル評価はあくまで交渉中の数字であり、ラウンドのクローズは2026年2月時点で未確認である。Gaussian Splattingベースの3D生成が、メッシュベースの既存ワークフローとどの程度シームレスに統合できるかも、実用化の重要な試金石となるだろう。

それでもなお、Fei-Fei Liが提唱する空間知能のビジョンは、AIの能力を「読み書き」から「空間の理解と創造」へと根本的に拡張するものである。World Labsの動向は、次世代AIプラットフォームの形を占う上で、最も注目すべき指標の一つであることは間違いない。

FAQ

World Labsの「Marble」は従来の動画生成AIと何が違うのか？

Sora等の動画生成AIがフレームごとのピクセル列を生成するのに対し、MarbleはGaussian Splattingにより永続的な3D環境を構築する。視点を自由に変えても幾何学的一貫性を保ち、編集やエクスポートも可能な点が根本的に異なる。

World APIは誰が利用できるのか？

2026年1月21日に一般公開されており、開発者はPython/JavaScript SDKを通じてアクセスできる。APIキーの生成、使用量管理、課金設定はWorld Labsプラットフォーム上で行える。

空間知能（Spatial Intelligence）はAGIに近づく技術なのか？

空間知能はAGIそのものではないが、AGIに必要とされる「世界理解」の重要な構成要素と位置づけられている。現在のLLMに欠けている3D空間推論・物理法則理解を補完する技術であり、AGIへの経路を拓く可能性があるとされている。

50億ドルの企業評価は妥当なのか？

2024年9月の10億ドルから16か月で5倍の上昇である。世界モデル分野への13億ドル超の資金流入、Marble・World APIの商用化実績を踏まえれば市場の期待を反映した数字だが、ラウンドのクローズは2026年2月時点で未確認であり、確定値ではない点に留意が必要である。

World Labsの競合はどこか？

Google DeepMind（Project Genie 3）、OpenAI（Sora 2）、Yann LeCun率いるAMI Labsが主要競合である。各社のアプローチは異なり、Genie 3はリアルタイムインタラクティビティ、Sora 2はストーリーテリング、AMI Labsは基盤モデル研究に重点を置いている。

参考文献

Fei-Fei Li's World Labs speeds up the world model race with Marble, its first commercial product — TechCrunch, 2025年11月12日
Announcing the World API — World Labs公式ブログ, 2026年1月21日
Fei-Fei Li's AI Startup World Labs in Funding Talks at $5 Billion Valuation — Bloomberg, 2026年1月23日
From Words to Worlds: Spatial Intelligence is AI's Next Frontier — Fei-Fei Li Substack
Fei-Fei Li's World Labs comes out of stealth with $230M in funding — TechCrunch, 2024年9月13日
Inside Fei-Fei Li's Plan to Build AI-Powered Virtual Worlds — TIME

World Labs「Marble」が定義する空間知能の実用化 ── Fei-Fei Liの3D世界生成AIと50億ドル評価の技術基盤