Kunlun Tech、SkyWork発表週を完結──Mureka V7.5とMoE-TTSでAI音楽と音声合成が新段階へ

出典:https://mp.weixin.qq.com/s/q61f8PeEhMzzLXUseQrY9A

Mureka V7.5とMoE-TTS
概要ポイント
  • Kunlun Techは5日間連続で新モデルを発表し、最終日にMureka V7.5を公開。
  • Mureka V7.5は中国語楽曲の音色・咬字・感情表現を大幅改善。
  • ASR技術を最適化し、人声の自然度と表現力を強化。
  • MoE-TTSは自然言語による声質制御を可能にし、閉源製品を上回る性能を示す。
  • 今後Mureka-Speechに統合し、開発者に開放予定。
本文

Kunlun Techは8月15日、AI音楽生成モデル「Mureka V7.5」を正式公開し、SkyWork AI技術発表週を締めくくった。5日間で発表されたモデル群は、SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0、Deep Research Agentに続き、AI多モーダル領域の広がりを示した。


Mureka V7.5は中国語楽曲に特化した表現力の強化が特徴で、音色や演奏技法だけでなく、歌詞の咬字や感情表現も改善された。ASR技術の最適化により、呼吸や感情の起伏を捉えた自然な人声生成を可能にし、従来の機械的な印象を大幅に軽減した。これにより、中国音楽の文化的要素をより忠実に再現する能力を獲得した。


同時に、Kunlun Techの音声チームは「MoE-TTS」を発表した。これはMixture of Experts構造を採用した音声合成フレームワークで、自然言語による声質やスタイルの精緻な制御を実現する。比喩や類推を含む複雑な表現にも対応し、既存の閉源TTS製品を上回る性能を示した。学術界へのオープンな貢献に加え、今後はMureka-Speech基盤に統合し、開発者やクリエイターに開放される予定である。


今回のMureka V7.5とMoE-TTSの発表は、AI音楽と音声合成の進化を象徴するものであり、バーチャルヒューマンやバーチャルアシスタント、没入型コンテンツ領域における新たな展開を予告するものとなった。