アリババ(阿里巴巴)が開発した大規模AIモデル「Wan2.1(万相2.1)」は、オープンソース化からわずか6日で、Hugging Faceのモデル人気ランキングとモデルスペースランキングで首位を獲得した。14Bバージョンは、高性能かつ無料で利用できる点が評価され、多くの開発者やユーザーの注目を集めている。一方、ローカル環境でのデプロイが可能な1.3Bバージョンも高く評価されており、一部ユーザーはその生成効果がより大きなモデルを超えていると述べている。
また、多くのユーザーがモデルスペースを通じてWan2.1(万相2.1)を利用しており、アクセスが集中し、常に待機列が発生する状態となっている。こうした需要の高まりを受け、アリババのWan開発チームは、ComfyUIやDiffusersといった主要フレームワークのサポートを追加し、さらに多くのユーザーが簡単にモデルを活用できるよう対応を進めている。
Wan2.1(万相2.1)は、最も自由度の高いApache2.0ライセンスのもとでオープンソース化され、14Bおよび1.3Bの2種類のパラメータサイズの推論コードと重みが公開されている。さらに、権威ある評価ベンチマークであるVBenchでは、総合スコア86.22%を記録し、Sora、Luma、Pikaといった国内外の競合モデルを大きく上回る成績を残している。
アリババは2023年以降、大規模AIモデルのオープンソース化を推進しており、すでにQwen(千問)とWan(万相)の2つの基盤モデルを公開済みだ。これにより、アリババは全モダリティ・全サイズの大規模モデルをオープンソース化するという目標を達成し、今後もさらなる技術の開発と普及を進めていくとみられる。
Wan2.1とは?:
Wan2.1(万相2.1)は、アリババが開発したマルチモーダル生成AIモデルで、テキストから画像や動画を生成できる能力を持つ。14Bと1.3Bの2種類のバージョンが提供され、特に14B版は高性能ながら無料で利用可能な点が特徴。最先端の評価指標で高いスコアを記録し、SoraやPikaといった既存の生成AIを超える性能が期待されている。
【関連リンク】
Wan2.1(Github):https://github.com/Wan-Video
Wan2.1(HuggingFace):https://huggingface.co/Wan-AI
Wan2.1(ModelScope):https://modelscope.cn/organization/Wan-AI