Kunlun Tech、世界モデル「Matrix-Game 2.0」をオープンソース公開──Genie 3同等性能を汎用シーンで実現

出典:https://mp.weixin.qq.com/s/PhnkrpTuQ-ntZfFNHTrGBw

概要ポイント
  • Genie 3同等のリアルタイム長尺インタラクション生成を国産で実現。
  • 業界初、汎用シーン対応の世界モデルを全面オープンソース化。
  • 25FPSで複雑な環境の分単位連続動画生成が可能。
  • 物理ルール・場面理解精度を維持しつつ低遅延を達成。
  • ゲーム・VR・エンボディードAIなど多用途に応用可能。
本文

Kunlun Techは8月12日、世界モデル「Matrix-Game」シリーズの最新バージョン「Matrix-Game 2.0」を発表した。本モデルはDeepMindのGenie 3と同様に、汎用シーンでのリアルタイム長尺インタラクション生成を実現し、業界で初めて全面オープンソース化された事例となる。推論速度は25FPSに達し、複雑な環境下でも分単位の連続動画生成が可能。


視覚中心の構造を採用し、言語依存の生成から脱却。3D Causal VAEと多モーダル拡散Transformerを組み合わせ、物理ルールと場面理解を高精度に保持しつつ、ユーザー指令に基づくインタラクション生成を可能にした。KV-Cacheの採用により長尺生成の安定性と効率を確保し、単GPU環境でもリアルタイム出力を実現している。


データ面では、Unreal EngineやGTA5を活用して約1,350時間の高品質インタラクション動画を生成。Matrix-Game Uni、TempleRun、GTAなど複数モデルを通じて都市や野外など多様な空間やビジュアルスタイルに対応できる汎用性を備える。これにより、ゲーム制作、VR、エンボディードAI、映像・メタバースコンテンツなど幅広い分野での応用が期待される。


Kunlun Techはこれまで「天工」ブランドの言語・多モーダルモデルやAIGC製品を展開しており、今回の開発は中国における空間知能研究の新たなマイルストーンとされる。「Matrix-Game 2.0」は、仮想世界構築やエンボディードAI訓練における基盤技術として大きな影響を与えるとみられる。