商湯科技(SenseTime)は、企業向けAI開発プラットフォーム「商湯大装置」において、DeepSeek-V3およびDeepSeek-R1の提供を開始した。これにより、企業や開発者は高度なAIモデルを素早く導入でき、3ヶ月間で最大1000万トークンを無料で利用できる。
さらに、業界特化型のモデルカスタマイズサービスを提供し、特定用途での精度向上と推論効率300%向上を実現する。商湯大装置は、クラウド、オンプレミス、一体型デバイスなど多様な環境でのデプロイをサポートし、NVIDIAや国産チップに対応。マルチチップ環境での最適な計算リソース配分を実現し、運用コストを抑えながら高いパフォーマンスを提供する。
また、推論最適化のための主要エンジン対応や、今後導入予定のPD(Prefill-Decode)分離式推論アーキテクチャにより、さらなる効率化を図る。計算タスクを分割し、最適な演算ユニットに割り当てることで、より高いエネルギー効率を実現する狙いがある。
商湯大装置は、官公庁、通信、金融、インターネット、自動車、テクノロジー企業など幅広い業界で導入され、業務の効率化と知能化を支援している。今後も技術・サービスの強化を継続し、企業が高効率かつ低コストでスケール可能なAIインフラを活用できるよう支援していく方針だ。