Kunlun Techは8月13日、統合型マルチモーダル生成モデル「Skywork UniPic 2.0」を全面オープンソース化した。本モデルは2Bパラメータ規模のSD3.5-Mediumアーキテクチャを基盤に、テキストからの画像生成と画像編集を単一フレームワークで実現。生成性能では12B規模のFlux.dev、編集性能ではFlux-Kontextを上回るなど、既存大規模モデルを凌駕する結果を示した。
構造面では、画像生成・編集モジュールと多モーダル理解モデルQwen2.5-VLを軽量接続器で統合し、統一的な理解・生成・編集能力を実現。さらにFlow-GRPOに基づく漸進的双任務強化戦略を導入し、生成と編集の両タスクを相互干渉なく同時最適化した。
今回の公開では、モデル重み、推論コード、強化学習戦略を含む全構成を提供。開発者や研究者はこれを基盤として迅速にマルチモーダルアプリケーションを構築可能となる。Kunlun TechはSkyReelsやMatrixシリーズなど他のオープンソースモデル群とも連携し、統合型モデル分野における技術的リードを強化している。