CAMEL-AIが開発した「OWL」、マルチエージェントによる高度な自動化タスク処理フレームワークを公開

出典:https://mp.weixin.qq.com/s/JVxz36V3iBCxXwa2NUCVSQ

概要ポイント
  • OWLはCAMELフレームワーク上に構築されたマルチエージェント自動化ツール。
  • ブラウザ操作やファイル処理、コード実行など複雑なタスクを自律的に実行可能。
  • GAIAベンチマークで平均58.18点を記録し、オープンソース内で最高評価。
  • PlaywrightやMCPToolkitの統合により高い拡張性を実現。
  • 実用デモでは検索、旅行計画、Pythonゲーム実行などの具体的ユースケースを紹介。
本文

CAMEL-AIチームが開発した「OWL(Open World Learning)」は、マルチエージェントによる自律的かつ高度なタスク自動化を実現する次世代フレームワークであり、CAMELプラットフォームを基盤として構築されている。複数のAIエージェントが役割を分担しながら、情報収集、ブラウザ操作、ファイル処理、コード実行といった複雑な作業を段階的かつ協調的に実行できる設計となっている。フレームワークの中核をなすのは、CAMELが提唱するRolePlaying方式で、各エージェントが「UserAgent」「AssistantAgent」などの役割を持ち、明確な対話構造のもとにタスクを分解・実行していく。


OWLはGAIAベンチマークにおいて58.18点という高スコアを記録し、オープンソースのマルチエージェント自動化フレームワークとしては現在トップレベルの評価を得ている。中でも注目されるのが、Playwrightベースで開発された「WebToolkit」によるブラウザ自動操作機能である。画面のスクリーンショット上に対話可能な要素を可視化・ラベル付けし、これを用いてエージェントが視覚的に操作する構造となっており、計画エージェント(planning_agent)と実行エージェント(web_agent)の連携により、複雑なWeb操作も人間の介入なく進行できる。


実際のユースケースとして、CaseOneでは「RedNote(小紅書)上で母の日向けのギフトを検索する」という指示に対し、WebToolkitを用いた高度なブラウザ制御が実行された。ログインポップアップの回避、検索ボックスの特定と入力、ページ遷移といった一連の流れがすべてエージェントの判断により自動で行われ、検索目的を正確に達成した。


続くCaseTwoでは、「中国・長沙への3日間の旅行プラン作成」という指示に対して、OWLはGoogle検索APIを用いて候補記事を自動取得。信頼性の高い3件を抽出後、それらのURLをDocumentProcessingToolkitで分析し、最終的に旅行日程として整理・提示するという流れを実現した。このようにOWLは、情報収集から選別、構造化までを一貫して処理可能であることが示された。


さらにCaseThreeでは、「Pythonで贈答用のスネークゲームを作成し、実行せよ」というタスクが提示された。OWLはまず仮想ワークスペースを立ち上げ、FileWriteToolkitでPythonコードを生成・保存。その後、TerminalToolkitを用いて実行環境を構築し、pygameライブラリの不足を自動で検出・インストール。最終的にゲームファイル(snake_game.py)を自律的に実行させることに成功した。この事例は、OWLがファイル操作、コード実行、エラー対処を含む高度なローカルタスクに対応できることを示している。


加えて、画像や音声、動画といったマルチモーダル情報にも対応しており、ImageAnalysisToolkit、AudioAnalysisToolkit、VideoAnalysisToolkitを通じて、視覚・聴覚データを解析し、タスク達成に役立てることが可能。さらには、SlackやGmailなどの外部サービスやローカルデータとの統合を可能にするMCP(Model Context Protocol)にも対応しており、MCPToolkitを用いることで多様な情報源との標準化された接続が実現されている。


これらの仕組みを支えるのが、CAMELによるRolePlayingベースの対話構造と、各ツールを動的に統合するエージェント設計である。ユーザーはタスクの目的だけを指定すれば、エージェントが状況に応じて最適なツールを選び、段階的に処理を進行させることができる。


CAMEL-AIは、こうした技術群をオープンソースとして公開し、開発者コミュニティの貢献を通じてフレームワークを進化させ続けている。公式GitHubには多数のコード例とドキュメントが用意されており、ユースケースの投稿によって実用性の高いテンプレートも充実しつつある。OWLは今後、企業業務の自動化や研究開発支援ツールとしての広範な応用が期待される。