Wenxiaobai(問小白)開発チームは、自社が提供する大規模言語モデル「Wenxiaobai DeepSeek R1」におけるRAG(検索拡張生成)能力の技術成果を公開した。Chinese SimpleQAによる評価においてF-score 91.6%という記録を達成し、GPT-4oを含む他の主要モデルを大きく引き離した。これにより、Wenxiaobai DeepSeek R1は現在のRAG技術分野における新たな基準と評価されている。
この成果の背景には、情報検索から回答生成までを一貫して最適化する独自の技術アーキテクチャがある。まず、ユーザーの質問意図を高精度で分析する「思考モデル」を導入し、適切な検索ツールの選定と活用を行う。次に、時事性や専門性の高い情報を収集する複数の検索エンジンを組み合わせ、最適な情報源を自動で選択する仕組みを整備している。
さらに、同チームは分野特化型の高品質な知識ベースを自社で構築。旅行や生活、書籍などの具体的なテーマに関する情報を事前に整理し、AIによる回答生成時にこれらの知識を補完的に活用することで、誤情報の発生(いわゆる「幻覚」)を大幅に抑制している。これにより、インターネット上の情報だけでは対応しきれない場面においても、信頼性の高い回答を実現できている。
また、大量に取得された情報から有用なものだけを選別するため、独自に訓練されたウェブ評価モデルが導入されている。関連性や内容の質、情報の完全性など多角的な指標でスコア付けを行い、不要な情報を排除した上で、最終的な回答に反映している。これにより、読み込み遅延を抑えながら高品質な出力が可能となっている。
WenxiaobaiはDeepSeek R1のフルスペック版推論モデルをベースにしているが、単なる実装に留まらず、継続的な独自チューニングによって性能をさらに引き上げている。これらの総合的な最適化により、同モデルはユーザーから「現時点で最強のRAG製品」との評価を受けている。
今後、WenxiaobaiチームはRAG技術の各工程のさらなる精緻化に取り組む方針を示している。マルチモーダル情報の統合や、より精度の高いウェブ情報抽出、知識ベースの効率的構築といった技術的課題に対し、段階的に対応していくという。また、RAG技術の応用分野を拡大し、複雑なタスクや専門領域における有効性検証にも力を入れていくことで、業界内での優位性をより一層強固なものにしようとしている。