DeepSeek、試験版(Experimental版)「V3.2-Exp」公開──スパース注意機構で長文処理を効率化、APIは半額に

出典:https://mp.weixin.qq.com/s/6hKi5F_S2zQ4g6SyF0UNow

DeepSeek-V3.2-Exp
概要ポイント
  • DeepSeek-V3.2-Expを公開、長文処理に特化。
  • スパース注意機構で訓練・推論効率を改善。
  • 公開ベンチマークでV3.1と同等性能を維持。
  • API価格を半額以下に引き下げ。
  • HuggingFaceとModelScopeでオープンソース公開。
本文

DeepSeekは実験的モデル「DeepSeek-V3.2-Exp」を公開した。前世代のV3.1-Terminusを基盤に、新たにスパース注意機構「DeepSeek Sparse Attention(DSA)」を導入。これにより長文入力での訓練・推論効率を大幅に向上させつつ、性能を維持している。公開ベンチマークではV3.1と同等の精度が確認された。


HuggingFaceとModelScopeでモデルがオープンソース公開され、研究に必要なTileLang版とCUDA版の算子も提供された。APIの価格も従来比で50%以上引き下げられ、開発者の利用コストが大幅に低減。公式アプリやウェブ版もすでにV3.2-Expに更新されている。


ユーザーによる実使用環境での検証を促すため、V3.1-TerminusのAPIも2025年10月15日まで限定提供され、同価格で比較テストが可能。DeepSeekはコミュニティからのフィードバックを広く募り、今後の改善に反映させる方針を示している。