中国のAI画像生成界隈が活況を呈している。GPT-4oによるジブリ風画像ブームに始まり、即夢3.0のグレースケールテストが話題となり、続いてMidjourneyがV7モデルを発表。その圧倒的なリアリティは、AI生成の新たな頂点を示した。
記事では、こうした状況を受けて、中国のクリエイター「一澤Eze」が提案した万能プロンプトテンプレートを用い、国内外の14種にわたる生成ツールの横断比較を実施。対象には即夢、Kling AI(可霊)、Wan(通義万相)、Xingliu(星流)、Doubao(豆包)、WHEE、LiblibAIなどの中国製に加え、Midjourney、ChatGPT 4o、Ideogram、Recraft、Leonardo.aiなどの海外製も含まれる。
プロンプトテンプレートは、簡単な画面イメージを入力するだけで、構造的かつ中英両対応の高精度プロンプトへと変換してくれる設計。これにより、初心者でもプロ並みの画像生成が可能になるという。実際に「オレンジジュースのボトル」「未来都市」「奇幻のミクロ世界」「労働節のポスター」など4つのテーマで、ツールごとの出力結果を比較。どのツールも同じプロンプトでも異なるビジュアルを生み出しており、AIごとの個性や表現力の違いが浮き彫りとなった。
こうした違いは、モデルの訓練データや画像生成アルゴリズムの特性によるものだが、共通して重要なのは「プロンプトの具体性」。抽象的な指示では曖昧な結果になりやすく、「太った白猫が草の上で寝ている写真風」といった精緻な描写こそが、AIの性能を最大限に引き出す鍵となる。
AIが人間の意図を理解するわけではないが、適切な言葉の設計によって、驚くほど意図に近いビジュアルが得られる。プロンプト設計力が、これからのAI活用における新たなスキルと位置づけられるだろう。