Kimi、新世代AIモデル「k1.5」発表—多モーダル推論能力を大幅強化

出典:https://mp.weixin.qq.com/s/BmOKGKjXP2tjmPyNdU0Hqg

概要ポイント
  • Kimiの最新AIモデル「k1.5」発表—数学、コード、視覚推論でSOTAレベルを達成。
  • 短・長推論で大幅向上—短思考推論でGPT-4oやClaude 3.5 Sonnetを550%上回る。
  • 長文コンテキスト対応—最大128kトークンのコンテキスト処理を実現。
  • 技術レポート初公開—Kimiの強化学習とモデル拡張の詳細を記録。
  • 今後の展望—さらなる多モーダル対応と幅広い分野への応用を計画。
本文

Moonshot AIは、最新AIモデル「k1.5 多モーダル思考モデル」を発表した。このモデルは、数学、コード、視覚認識を含む幅広い領域で高度な推論能力を持ち、世界的にSOTA(state-of-the-art)レベルの性能を達成している。

特に、短思考推論(Short-CoT)ではGPT-4oやClaude 3.5 Sonnetを550%上回る精度を記録し、長思考推論(Long-CoT)ではOpenAIのo1モデルと並ぶ水準に到達。Kimiは、この成果により、OpenAI以外の企業として初めてo1レベルの多モーダル推論を実現したとされる。

また、Moonshot AIは今回、初めてKimiのモデル訓練技術に関する詳細なレポートを公開。長文コンテキストの拡張、強化学習の最適化、シンプルなLLM学習フレームワークの導入など、技術的進歩が紹介されている。

Kimiのk1.5モデルは、最大128kトークンの長文処理が可能であり、より複雑な問題への対応力を強化。特に、LaTeX形式を用いた数学的処理では卓越した性能を発揮している。

今後、Kimiはさらなる進化を予定しており、多モーダル対応の拡張や新たな分野への適用が計画されている。最新バージョンのKimiは、公式サイトおよびアプリで試験的に提供が開始されており、技術者や研究者は今後の発展に注目している。