DeepSeekが開発する次世代AIモデル「DeepSeek-R2」が、当初5月に予定されていたリリースを前倒しする可能性があると報じられている。R2モデルは、コード生成能力の向上や英語以外の言語での推論強化が期待されており、AI業界に新たなインパクトを与えるとみられる。
DeepSeekは2023年7月の設立以来、プログラミング、数学的推論、大規模言語モデル、多モーダル対応、対話型AIなど、多岐にわたる分野でAIモデルを開発してきた。特に、前モデルであるR1は高い性能と低コストでのトレーニングにより注目を集め、業界内外から高く評価された。R1の成功を受け、国内のスマートフォンメーカーやインターネット企業が次々とR1を自社製品やサービスに統合し、AI導入を加速させている。
R2モデルでは、動的スパースアーキテクチャ、量子化知識蒸留、混合エキスパート(MoE)アーキテクチャ、多頭潜在注意(MLA)などの技術を活用し、さらなるコスト削減と性能向上を実現。トレーニングコストの低減、推論能力の強化、応答速度の向上が期待されている。
DeepSeekはオープンソース戦略を推進し、R2モデルも他の企業や個人が自由に展開・使用・改良・配布できるようにする方針。オープンソースの活用は、AI業界全体の発展を促進し、競争力を高める要因となる。R2の登場によって、AIモデルの開発競争はさらに激化することが予想される。