DeepSeek-R1が公開、OpenAI o1相当の性能を達成し小モデル展開も可能に

出典:https://mp.weixin.qq.com/s/atKyfC5l-BaStje8-F3FGQ

概要ポイント
  • 大規模モデル「DeepSeek-R1」を公開:MITライセンスで提供し、OpenAI o1相当の推論性能を達成
  • 小型モデルを追加提供:R1出力を基に6種類のモデルをコミュニティへ開放
  • 思考過程(思維链)出力に対応:model='deepseek-reasoner'設定でChain-of-Thoughtの参照が可能
  • ライセンス・利用規約の緩和:標準的なMIT方式に統一し、商用活用や再学習を自由化
  • APIと料金体系:入力1〜4元/百万tokens、出力16元/百万tokensで利用可能
本文

DeepSeekは2025年1月20日、「DeepSeek-R1」を正式リリースし、モデルの重みをMITライセンスでオープンソース化した。強化学習を用いることで、わずかな注釈データでも数学・コード・自然言語推論などでOpenAI o1に匹敵する性能を示しており、研究者や実務利用者の注目を集めている。

特筆すべきは、R1の出力を活用して複数の小型モデルを生成し、それらをコミュニティに向けて公開した点だ。32Bや70Bなどの異なるモデル容量でOpenAI o1-miniを超える成果を示し、さまざまなニーズに応えられる柔軟なアーキテクチャとなっている。

同社はライセンス面でも従来の「DeepSeek License」を廃止し、標準的なMITライセンスへ移行。商用利用や派生モデルの再学習、モデル出力を基にした追加開発などを制限なく行える体制を整備した。また、API呼び出し時にmodel='deepseek-reasoner'と設定すれば、Chain-of-Thought(思維链)の推論過程を取得できる点も大きな特徴で、AIの思考プロセスをより詳細に観察可能だという。

API利用料金は入力トークンがキャッシュ状況に応じて百万単位1元または4元、出力が16元。DeepSeek公式サイトやAppを介して即日利用を開始でき、さらに詳細なドキュメントは同社の開発者向けページに公開されている。今後は技術コミュニティとの連携を強化し、多岐にわたる分野での応用を推進する方針を示している。