DeepSeek、最新モデル「DeepSeek-V3.1」を公開──思考モード切替とエージェント強化へ

出典:https://mp.weixin.qq.com/s/WUbmBSapVyvxZe6HobD5Qw

DeepSeek-V3.1
概要ポイント
  • 思考/非思考モードを切替可能な混合推論アーキテクチャを採用。
  • エージェント機能が強化され、コード修復や検索タスクで性能向上。
  • 思考効率が改善し、トークン消費を抑制しつつ精度を維持。
  • APIは128Kコンテキスト対応、Anthropic形式互換も追加。
  • Base/後訓練モデルをHugging FaceとModelScopeで公開。
本文

DeepSeekは最新モデル「DeepSeek-V3.1」を正式に公開した。最大の特徴は、思考モードと非思考モードを切り替え可能な混合推論アーキテクチャを採用した点にある。従来モデルと比較し、思考効率が大幅に改善され、R1-0528と同等の精度を維持しながら出力トークン数を20〜50%削減することに成功した。また、プログラミングや検索といったエージェント機能も強化され、コード修復や複雑な検索課題で従来を上回る成果を示した。


APIも同時にアップグレードされ、128Kコンテキスト対応に加え、Function Callingのstrictモードをサポート。Anthropic API形式との互換性も追加され、Claude Codeなど外部フレームワークへの統合が容易になった。さらに、Baseモデルと後訓練済みモデルはHugging FaceとModelScopeで公開されており、開発者は自由に利用できる。


価格面では、9月6日からAPIの新料金体系を導入し、夜間割引を廃止する一方で、リソース拡張により利用者の需要に対応する方針を示した。これにより、DeepSeekは次世代のエージェント時代に向けた第一歩を踏み出したといえる。