Kunlun Tech(昆侖万維)、ソフトウェア工学特化のコード修復AI「Skywork-SWE-32B」を公開──GitHub実データ1万件で性能向上を実証

出典:https://mp.weixin.qq.com/s/5mUHAcBo_czQ3fjq4AwQQg

Skywork-SWE-32B
概要ポイント
  • Kunlun Tech(昆侖万維)がSWE特化のAIモデルSkywork-SWE-32Bを発表・オープンソース化
  • GitHub実案件1万超を用いた検証可能な大規模データセットSkywork-SWEを構築
  • SWE-bench Verifiedでpass@1スコア38.0%、TTS導入後は47.0%に向上
  • GPT-4.1-miniやClaude v3.5などオープンソース以外のモデルを上回る性能
  • 今後は多言語対応や強化学習との融合も視野に入れて開発を継続
本文

2025年6月、Kunlun Tech(昆侖万維)はソフトウェア工学(SWE)タスクに特化した自主開発のコードインテリジェントモデル「Skywork-SWE-32B」を発表し、同時にオープンソースとして公開した。本モデルは、実際のGitHubリポジトリから構築された業界最大級の可検証コード修復データセット「Skywork-SWE」を活用し、SWE-bench Verifiedベンチマークにおいて38.0%のpass@1精度を記録。さらにテスト時拡張技術により47.0%まで向上し、同等規模の他モデルやオープンソース以外の大規模モデルを上回る結果を示した。


Skywork-SWE-32Bは、単なるコード生成ではなく、実際の開発現場に即したバグ特定・修正・検証までをAIが一貫して処理できることを示している。OpenHandsフレームワークを基盤に、複数ファイルの依存処理やツールチェーン利用も可能で、実用的な開発支援を実現している。


学習には、15万件のGitHubリポジトリから厳選された1万件超の高品質SWEタスクを用い、3段階9ステップの自動化フローにより収集・検証された8,209件の多段階対話付きデータを活用。これによりSkywork-SWE-32Bは高い実行性能と柔軟性を獲得した。


Kunlun Techは今後、Skywork-SWE-32Bの多言語対応や実行時フィードバックとの統合による強化学習への応用を見据えており、ソフトウェア開発における真にインテリジェントなエージェントの実現に向けて開発を継続する方針を示している。