Kunlun Techは8月15日、AI音楽生成モデル「Mureka V7.5」を正式公開し、SkyWork AI技術発表週を締めくくった。5日間で発表されたモデル群は、SkyReels-A3、Matrix-Game 2.0、Matrix-3D、Skywork UniPic 2.0、Deep Research Agentに続き、AI多モーダル領域の広がりを示した。
Mureka V7.5は中国語楽曲に特化した表現力の強化が特徴で、音色や演奏技法だけでなく、歌詞の咬字や感情表現も改善された。ASR技術の最適化により、呼吸や感情の起伏を捉えた自然な人声生成を可能にし、従来の機械的な印象を大幅に軽減した。これにより、中国音楽の文化的要素をより忠実に再現する能力を獲得した。
同時に、Kunlun Techの音声チームは「MoE-TTS」を発表した。これはMixture of Experts構造を採用した音声合成フレームワークで、自然言語による声質やスタイルの精緻な制御を実現する。比喩や類推を含む複雑な表現にも対応し、既存の閉源TTS製品を上回る性能を示した。学術界へのオープンな貢献に加え、今後はMureka-Speech基盤に統合し、開発者やクリエイターに開放される予定である。
今回のMureka V7.5とMoE-TTSの発表は、AI音楽と音声合成の進化を象徴するものであり、バーチャルヒューマンやバーチャルアシスタント、没入型コンテンツ領域における新たな展開を予告するものとなった。