テンセント「混元」シリーズが世界トップ8入り──TurboS強化で多モーダルモデルも一斉アップグレード

出典:https://mp.weixin.qq.com/s/2th-uGwaTzx_54FWE5vCdw

混元モデル
概要ポイント
  • 混元TurboSがChatbot Arenaで世界8位にランクイン、中国勢ではDeepSeekに次ぐ評価。
  • 画像理解のT1-Vision、音声通話のVoiceなど多モーダルモデルを新たに発表。
  • Image 2.0はミリ秒レベルの生成を実現、3D v2.5は4K高精度出力に対応。
  • ゲーム用ビジュアル生成モデルを公開し、産業応用を加速。
  • 全モーダルでのオープンソース展開を継続し、多サイズのモデルも開発中。
本文

テンセントが展開するAIモデル「混元(Hunyuan)」が、2025年に入ってから急速にアップグレードを続けている。旗艦モデル「混元TurboS」は、LLM性能評価指標「Chatbot Arena」にて世界8位にランクインし、中国ではDeepSeekに次ぐ評価を受けた。


TurboSは業界初の大規模Mamba-MoE混合モデルで、数学推論能力が10%以上、コード処理能力が24%向上し、競技数学の精度は39%アップした。これを基盤に、画像理解モデル「T1-Vision」や音声通話モデル「混元Voice」が新たに公開され、それぞれ高速化と高精度化を実現している。


Image 2.0はミリ秒単位の画像生成を可能とし、主観評価でも「AI味」が少ないとされる品質を実現。3D v2.5では、業界初のスパース3Dアーキテクチャにより幾何精度が10倍に向上し、4Kテクスチャにも対応した。


ゲーム分野では、リアルタイムでのキャラクター生成、スキル演出、インタラクティブなゲーム空間の構築などに対応したビジュアル生成モデルを発表。今後は、大規模な可動3D空間を生成し、360度での体験が可能なモデルも登場予定とされている。


混元シリーズは、画像・映像・3D・テキストの各領域でオープンソース化を進めており、Hugging Faceでのダウンロード数は累計160万回を超える。今後は、0.5B〜32Bまでのサイズを持つモデル群の開発や、MoEの13Bモデルなども予定しており、企業用途から端末向けまでをカバーする方針を示している。


また、テンセントは無料リソースと技術支援を提供する「混元訓練キャンプ」も展開しており、200社以上の企業が参加を申し込んでいる。