Moonshot AI、「Kimi-Researcher」をクローズドテスト開始──深度研究特化エージェントがClaudeやGeminiを超える精度を記録

出典:https://mp.weixin.qq.com/s/YV4M8YNZ5hnzfxaFQ7PL9A

概要ポイント
  • Moonshot AIが「Kimi-Researcher」のクローズドテストを開始。
  • 自主強化学習により検索・分析・レポート作成を一貫して自律処理。
  • HLEベンチマークでClaude 4やGemini 2.5を上回る精度を記録。
  • 可視化レポートや出典付き万字レポートを自動生成。
  • 法務・教育・学生など多様な応用シーンで実用例を紹介。
本文

Moonshot AIが開発したエージェント型AI「Kimi-Researcher」が、クローズドテスト段階に入った。Kimi-Researcherは、端から端まで一貫して自律的に処理を行う設計となっており、高度な調査や分析を目的とした研究支援に特化している。


検索キーワードの選定、数百件のウェブ情報の収集、情報の信頼性判定、重複排除、ツール活用を通じて、1万字以上のレポートと、視覚的に要点を整理した可視化レポートを自動生成する。すべての出典はクリック可能で、検証・追跡が容易な設計となっている。


評価指標として導入された「Humanity’s Last Exam(HLE)」では、Claude 4(10.7%)やGemini 2.5 Pro(21.6%)を上回る26.9%のPass@1スコアを記録。xbench評価でも他モデルを上回る成績を示し、業界トップ水準のリサーチ性能を持つ。


さらに、Kimi-Researcherは法務分野での多国籍データ法の調査、教育現場での教案作成、学生による国際通貨制度の学習支援など、具体的な活用例も紹介されており、個人ユーザーによる専門的なリサーチ作業を強力に支援するツールとして注目されている。


モデルは「ゼロプロンプト・ゼロ構造」で設計されており、明示的な手順や指示がなくとも強化学習を通じて自律的に解法を獲得。モデル自身が必要な情報の記憶や活用を判断し、タスク達成のみに報酬を与える設計により、高い適応力と汎用性を持つ。