アリババのTongyi Labは、新モデル「Qwen3-Max-Preview(Instruct)」を発表した。今回のモデルはパラメータ数が1兆を超える大規模構成で、これまでのQwenシリーズで最大規模となる。ベンチマーク結果では、一般知識を測るSuperGPQA、数学推論のAIME25、プログラミングのLiveCodeBench v6、人間の嗜好適合を測るArena-Hard v2、総合性能評価のLiveBenchなどで、Claude-Opus 4(Non-Thinking)やKimi-K2、DeepSeek-V3.1、従来のQwen3-235Bモデルを上回った。
内部テストや初期ユーザー評価でも、知識の広さや対話能力、エージェントタスク処理、指令遵守において一段と強力な性能を示している。これにより、モデル規模の拡大が依然として性能向上に有効であることが裏付けられた。
Qwen3-Max-Previewは阿里雲の百煉プラットフォームを通じてAPIで利用可能となり、同時にQwen Chatにも搭載され無料で体験できる。正式版「Qwen3-Max」の登場も予告されており、今後の進化に注目が集まる。