中国のAIスタートアップDeepSeekは、2024年3月24日夜に事前告知なしで自社大規模言語モデル「DeepSeek-V3」のアップグレード版(V3-0324)をリリースした。これまでと同様、公式アナウンスを避けた「静かなアップデート」として公開されたこのモデルは、ウェブ版、アプリ、小プログラムを通じて広く利用可能となっている。
今回のバージョンは噂されていた次期大型モデル「V4」や「R2」ではないものの、6850億パラメータを備えたオープンソースモデルとして注目を集めている。初代V3は訓練コストわずか557.6万ドルでClaude 3.5に匹敵する性能を示し、そのコストパフォーマンスの高さで話題を呼んだ経緯がある。今回のアップグレード版も登場直後から開発者たちが次々と試用に乗り出し、Redditなどでレビューが共有されている。
ユーザーのフィードバックによると、新モデルはJavaScriptやTypeScriptなどのプログラミング言語におけるコード補完やバグ検出の精度が向上しており、開発者からは「これまでで最も実感できる進化」と評価されている。また、対話時の表現も従来より自然で人間らしくなったとの声が多い。一方で、一部ユーザーからは「今回は小幅な更新に留まり物足りない」として、次世代モデル「R2」への期待が寄せられている。
DeepSeekは初代V3を「Chatbot Arena」で唯一トップ10入りしたオープンモデルとして知られており、今回の6850億パラメータ版もすでに全体のモデル重みが公開されている。これにより、企業によるAI導入のハードルがさらに下がると見られる。