2025年3月16日、バイドゥ(百度)は自社開発の大規模AIモデル「ERNIE(文心大模型)4.5」と「ERNIE(文心大模型)X1」の2モデルを正式発表した。両モデルはすでに文心一言公式サイトで無料公開されており、ユーザーは無償で体験可能。企業や開発者向けにはバイドゥ(百度)スマートクラウドの「千帆」プラットフォームを通じたAPI提供も開始している。
「ERNIE(文心大模型)4.5」は、マルチモーダル(画像、音声、動画、テキスト)対応の基礎モデルであり、マルチモーダル理解能力や言語生成能力、論理推論、記憶力、コード処理能力などが大幅に向上した。新技術として、動的注意力マスク「FlashMask」、異種専門家モジュールによるモーダル融合、時空表現圧縮、知識密度の高いデータ構築、自律的フィードバックを活用した後学習技術などを取り入れている。
一方、「ERNIE(文心大模型)X1」は、理解・計画・反省・進化といった思考力を重視したモデルで、マルチモーダル対応に加え、ツールの自律活用が可能となった点が特徴。画像理解、文献検索、AI描画、コード解釈、リンク読み込み、ツリーマップ生成、ビジネス情報検索など、多様なツールを組み合わせて活用できる。特に、文学作品の再構成や複雑な論理構築といった高度なタスクで高いパフォーマンスを示している。
「ERNIE(文心大模型)X1」の性能向上は、段階的強化学習や思考チェーンと行動チェーンを用いたエンドツーエンド学習、多様な報酬を統合したトレーニングフレームワークによって実現されている。なお、APIの価格設定も競争力があり、「ERNIE(文心大模型)X1」は入力0.002元/千tokens、出力0.008元/千tokensと低価格で提供予定となっている。
バイドゥ(百度)は2025年を「大模型の全面進化の年」と位置づけ、AI、データセンター、クラウドインフラへの投資を加速させる方針を明らかにした。