Kunlun Tech、統合型マルチモーダル生成モデル「Skywork UniPic 2.0」を完全オープンソース化──軽量高性能な生成・編集一体化を実現

出典:https://mp.weixin.qq.com/s/CN8NaVnxsqxFe6WF_eo2iA

概要ポイント
  • 2B規模で12B級モデルを超える画像生成・編集性能を達成。
  • Qwen2.5-VLと接続し理解・生成・編集の統合を実現。
  • Flow-GRPOによる漸進的双任務強化学習で性能向上。
  • モデル・コード・強化戦略を含め全面オープンソース化。
  • 多様なSkyworkシリーズと連携し開発者支援を強化。
本文

Kunlun Techは8月13日、統合型マルチモーダル生成モデル「Skywork UniPic 2.0」を全面オープンソース化した。本モデルは2Bパラメータ規模のSD3.5-Mediumアーキテクチャを基盤に、テキストからの画像生成と画像編集を単一フレームワークで実現。生成性能では12B規模のFlux.dev、編集性能ではFlux-Kontextを上回るなど、既存大規模モデルを凌駕する結果を示した。


構造面では、画像生成・編集モジュールと多モーダル理解モデルQwen2.5-VLを軽量接続器で統合し、統一的な理解・生成・編集能力を実現。さらにFlow-GRPOに基づく漸進的双任務強化戦略を導入し、生成と編集の両タスクを相互干渉なく同時最適化した。


今回の公開では、モデル重み、推論コード、強化学習戦略を含む全構成を提供。開発者や研究者はこれを基盤として迅速にマルチモーダルアプリケーションを構築可能となる。Kunlun TechはSkyReelsやMatrixシリーズなど他のオープンソースモデル群とも連携し、統合型モデル分野における技術的リードを強化している。