北京大学の肖睿チームが作成した「DeepSeekプロンプトエンジニアリングと応用シナリオ」の86ページにわたる文書が流出し、学術界で大きな話題となっている。これは、国産の推論大規模モデルであるDeepSeek-R1の実践的応用を体系的に解明した初の公開資料であり、実験室から産業化への重要な道筋を示している。
この文書は、技術的特徴、応用論理、限界の3つの側面からDeepSeek-R1を客観的に分析している。技術的には、混合専門家(MoE)とマルチヘッド潜在注意(MLA)の協調設計を採用し、数学的推論やコード生成タスクで高い精度を達成している。また、モデル蒸留とFP8混合精度トレーニングにより、推論コストを大幅に削減し、同様のモデルと比較して83%のコスト削減を実現している。さらに、CEVALなどの中国語ベンチマークテストで、言語理解と生成スコアがGPT-4oを8.7ポイント上回り、特に行政文書や教育資料のシナリオで強力な適応性を示している。
プロンプトエンジニアリングの面では、「逆向き質問」メカニズムを通じてモデルの深い推論能力を引き出し、少数ショット学習シナリオでのパフォーマンスの変動を指摘している。また、「行政モード」や「教育モード」などの事前設定された指令セットを公開し、特定の分野への適応性を高めている。
一方、清華大学が作成した「DeepSeek入門から応用2025」は、DeepSeekの基礎から応用までを包括的に解説した104ページの技術資料である。清華版は、DeepSeekの技術的原理やプロンプト設計の理論を詳細に解説し、AIの効率的な活用方法に重点を置いている。特に、AIの「幻覚」を抑える技術や高度なプロンプトの設計手法を網羅しており、技術志向のユーザー向けに作られている。これに対し、北京大学版はより実践的で、業務効率化や具体的なユースケースに重点を置いている。
産業応用においては、長文生成タスクでの事実誤り率、ハードウェア要件の高さ、中小企業における精度とコストのバランス、教育分野での学習曲線の急峻さなどの課題も浮き彫りにしている。これらの課題は、モデルの実際の応用における重要な検討事項である。
このように、北京大学の実践は、大規模モデルの価値実現が産業の痛点に対する精密な対応にあることを示唆している。文書の第58ページには、「80点のAIに120点の要求を解決させるのは災難だが、90点のAIに60点のシナリオに専念させるのがビジネスである」と記されており、これは商業的応用における現実的な戦略を反映している。