Kunlun Tech(昆侖万維)、世界初の音楽推論大規模モデル「Mureka O1」を発表 ─ Suno超えの性能でAI音楽時代を先導

出典:https://mp.weixin.qq.com/s/1JPYXUwX-1JAVpz3IgygtQ

概要ポイント
  • Mureka O1は世界初の音楽推論大規模モデルで、Sunoを凌駕する性能を実現。
  • 独自技術「MusiCoT」により音楽構造の一貫性と生成品質を大幅に向上。
  • Mureka V6とO1は多言語・多ジャンル・多感情に対応した生成機能を備える。
  • 音色クローンやリファレンス生成など先進機能で個人化にも対応。
  • APIとモデル微調整機能の公開で、開発者向けに強力な制作基盤を提供。
本文

2025年3月26日、Kunlun Tech(昆侖万維)はAI音楽分野における革新的な技術として、世界初の音楽推論大規模モデル「Mureka O1」と、最新版の基盤モデル「Mureka V6」を正式に発表した。とりわけ注目されるのが、Mureka O1に実装された独自技術「MusiCoT(Music Chain-of-Thought)」である。これは、音楽生成に思考の流れを持ち込み、構造的な整合性と芸術的な一貫性を大幅に高める新たなアプローチだ。


MusiCoTは、従来のトークンを一つずつ予測する自回帰モデルとは異なり、まず楽曲全体の構造を先に生成することで、より滑らかで統一感のある音楽を生み出す。ベースにはCLAP(Contrastive Language-Audio Pretraining)モデルが用いられており、ラベル付けなしの大量データを活用して高い拡張性と説明可能性を実現している。この技術により、楽器の配置やメロディの流れ、音色の表現が自然に整い、AI音楽生成の品質が一段と高まった。


性能面でも、Mureka O1は米国の代表的音楽生成モデル「Suno V4」を明確に上回る結果を出している。音節の正確性、歌詞との一致度、ボーカルの質感、ミックスの精度、さらには楽曲構成とモチーフの完成度において、主観評価・客観評価の両面で圧倒的なリードを見せた。特に人間の耳での聴感評価では、Mureka O1が提供する音楽体験がSunoよりも豊かで印象深いとされている。


Mureka V6とO1は、英語・中国語・日本語・韓国語・フランス語など10の言語に対応し、ジャズ、ポップ、ロック、R&B、エレクトロニックなど多彩なジャンルに対応する。感情の表現力にも優れ、明るさ、悲しみ、エネルギー、神秘性など、さまざまなムードに合わせた音楽生成が可能だ。入力されたテキストプロンプトに応じて、数秒で高品質な楽曲が完成する。


さらにMurekaには、2つの革新的な生成機能がある。1つは「音色クローン(Vocal Clone)」で、ユーザー自身の声をアップロードしてAIに学習させ、本人そっくりの歌声で歌わせることができる。もう1つは「リファレンス生成(Reference)」で、既存の音源やYouTubeリンクを入力すると、それをヒントに新しい曲を自動生成できる。これにより、より個人化された音楽創作が可能となり、誰でも自分だけのAIシンガーやオリジナルソングを作れる時代が到来した。


開発者や企業に向けたエコシステム構築も進んでいる。Kunlun Techは、Murekaの音楽生成APIおよび音声合成APIの提供を開始し、同時にモデルの微調整機能も世界で初めて公開した。音楽生成APIでは、テキスト、音声リファレンス、音色情報など複数の形式に対応し、コンテンツ制作、ゲームBGM、短尺映像など多彩な用途に展開できる。音声合成API「Mureka TTS」も高評価を得ており、ElevenLabsやOpenAIを凌ぐ品質を見せている。


さらに、企業やアーティストは自分の楽曲データを使ってMurekaモデルを微調整することが可能になっており、自社ブランドに最適化された音楽生成や、アーティストの個性に合わせた曲作りが容易になる。この微調整機能は、ユーザーが提供したデータを第三者に公開しないことを明言しており、プライバシーと所有権をしっかりと守る構造となっている。


Kunlun Techは、今後もMurekaシリーズのモデル拡張と新機能開発を続け、音楽生成の二次編集やリミックス支援、さらにはインタラクティブ音楽生成などへと展開を進める方針だ。音楽とAIの融合を次なる段階へと導くMurekaは、音楽制作の在り方そのものを根本から変える可能性を秘めている。