2025年6月、Kunlun Tech(昆侖万維)はソフトウェア工学(SWE)タスクに特化した自主開発のコードインテリジェントモデル「Skywork-SWE-32B」を発表し、同時にオープンソースとして公開した。本モデルは、実際のGitHubリポジトリから構築された業界最大級の可検証コード修復データセット「Skywork-SWE」を活用し、SWE-bench Verifiedベンチマークにおいて38.0%のpass@1精度を記録。さらにテスト時拡張技術により47.0%まで向上し、同等規模の他モデルやオープンソース以外の大規模モデルを上回る結果を示した。
Skywork-SWE-32Bは、単なるコード生成ではなく、実際の開発現場に即したバグ特定・修正・検証までをAIが一貫して処理できることを示している。OpenHandsフレームワークを基盤に、複数ファイルの依存処理やツールチェーン利用も可能で、実用的な開発支援を実現している。
学習には、15万件のGitHubリポジトリから厳選された1万件超の高品質SWEタスクを用い、3段階9ステップの自動化フローにより収集・検証された8,209件の多段階対話付きデータを活用。これによりSkywork-SWE-32Bは高い実行性能と柔軟性を獲得した。
Kunlun Techは今後、Skywork-SWE-32Bの多言語対応や実行時フィードバックとの統合による強化学習への応用を見据えており、ソフトウェア開発における真にインテリジェントなエージェントの実現に向けて開発を継続する方針を示している。