Kimi K2、1兆パラメータのAgent/Coding特化型モデルを発表──コード生成・ツール操作・物語創作まで対応、即日オープンソース化

出典:https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ

概要ポイント
  • Kimi K2はコード生成とAgentタスクに特化したMoEアーキテクチャの大規模言語モデル
  • 1Tパラメータ・32B活性パラメータ構成で複数ベンチマークにてSOTA達成
  • MuonClip最適化器により安定かつ効率的な大規模学習を実現
  • Agent的ツール使用やスタイル変換、フィクション創作にも高性能を発揮
  • API、GUI、Hugging Faceモデルが即日公開され、自由に利用可能
本文

Moonshot AIは、1兆パラメータ規模のMoEアーキテクチャを採用した大規模言語モデル「Kimi K2」を正式発表し、同時にオープンソース化した。Kimi K2はコード生成やAgentタスクに強みを持ち、Tau2やSWE Bench VerifiedなどのベンチマークでSOTA性能を記録。Agentic Tool Use、数学的推論、スタイル変換、SF的な物語創作など幅広い能力を備える。


同モデルはMuonClipと呼ばれる新たな最適化手法を用いることで、1Tパラメータにおけるトークン使用効率と学習安定性を向上。学習済トークン数は15.5兆にも及ぶ。さらに、複雑なマルチツール使用を想定したデータの自動合成や、自律的な自己評価機構による強化学習にも対応し、汎用知能としての能力向上が図られている。


コード生成においては、HTMLベースの3Dビジュアライゼーションやトレーディングシミュレータの自動構築を行い、Agent機能では13万行のデータから可視化付き統計レポートを自動生成するなど、実践的な応用力を持つ。さらにスタイル変換では中学生風の表現から広告文風の表現まで自在に操り、物語創作ではディープな感情表現や哲学的なテーマにも対応している。


Kimi K2にはベースモデル(Kimi-K2-Base)と指令チューニング済モデル(Kimi-K2-Instruct)の2種があり、両方ともHugging Face上で公開されている。APIは128Kトークンまで対応し、OpenAI・Anthropic両方の仕様と互換性がある。ToolCall機能はAgentタスクにおける構文の正確性を保障する設計となっている。料金は入力100万トークンあたり4元(約90円)、出力は16元(約360円)である。


同社はKimi K2の開発と開放を通じて、AGI(汎用人工知能)の社会実装を加速させる意向を示している。