アリババ傘下のTongyi Labは、Web上での複雑な検索・推論タスクに特化したネットワークエージェント「WebSailor(WebAgent)」をオープンソースで公開した。WebSailorは、BrowseCompベンチマークにおいて、DeepSeek R1やGrok-3といった競合モデルを上回り、オープンソースエージェント中でトップの性能を記録した。
WebSailorは、Qwenモデルをベースに、高度な不確実性を含む検索タスクデータ「SailorFog-QA」によって事後学習されており、複雑な問題に対してマルチステップの推論とクロスサイト検証による解答導出を可能にしている。加えて、Tongyi Labが開発したDUPO(Dual-phase dynamic sampling)アルゴリズムにより、強化学習の訓練効率は従来の2〜3倍に向上し、ツールとの高密度な対話環境にも対応可能となっている。
GitHub上のリポジトリでは、エージェント本体のコードに加え、デモ実行環境、評価スクリプト、主要データセット(BrowseComp、SailorFog-QA)、およびツールAPIが公開されており、研究者や開発者が即座に再現・応用できる構成となっている。特にCLI(コマンドライン)とWeb UIの両方に対応した推論インターフェースが整備されており、タスク登録、ツール選択、情報抽出・統合、自然言語出力まで一貫したパイプライン設計が特徴だ。
Tongyi LabはWebSailorを単なるモデルとしてではなく、汎用的なワークフロー設計の実装例として位置づけており、「高難度合成+小規模冷却スタート+高効率最適化」の戦略が、学術研究、マルチモーダル統合、オープンドメインQAなど他領域にも応用可能であることを示している。