アリババ、超1兆パラメータの「Qwen3-Max-Preview」を公開──世界最先端性能を実証

出典:https://mp.weixin.qq.com/s/JQocVWFMgBemmRnip7mzqQ

Qwen3-Max-Preview
概要ポイント
  • Qwen3-Max-Previewはパラメータ数が1兆超
  • 複数ベンチマークでClaude-Opus 4やDeepSeek-V3.1を上回る性能
  • 内部テストで知識幅、対話力、エージェント性能が向上
  • Alibaba Cloud Bailian APIとQwen Chatで提供開始
  • 正式版「Qwen3-Max」も今後公開予定
本文

アリババのTongyi Labは、新モデル「Qwen3-Max-Preview(Instruct)」を発表した。今回のモデルはパラメータ数が1兆を超える大規模構成で、これまでのQwenシリーズで最大規模となる。ベンチマーク結果では、一般知識を測るSuperGPQA、数学推論のAIME25、プログラミングのLiveCodeBench v6、人間の嗜好適合を測るArena-Hard v2、総合性能評価のLiveBenchなどで、Claude-Opus 4(Non-Thinking)やKimi-K2、DeepSeek-V3.1、従来のQwen3-235Bモデルを上回った。


内部テストや初期ユーザー評価でも、知識の広さや対話能力、エージェントタスク処理、指令遵守において一段と強力な性能を示している。これにより、モデル規模の拡大が依然として性能向上に有効であることが裏付けられた。


Qwen3-Max-Previewは阿里雲の百煉プラットフォームを通じてAPIで利用可能となり、同時にQwen Chatにも搭載され無料で体験できる。正式版「Qwen3-Max」の登場も予告されており、今後の進化に注目が集まる。