AI生成をフル活用して、存在しないアーティストのミュージックビデオを作成してみる
https://youtu.be/1GhAkSGIQu4
存在しないアーティストによる、存在しない楽曲『Baby steps』。
このコンセプトのもと、AI技術をフル活用してミュージックビデオを制作しました。
【使用ツール・環境一覧】
■ 画像・動画生成
- Nanobanana Pro
- Veo3.1
- Higgsfield
- Wan(via ComfyUI)
- Adobe Photoshop
■ 編集
- Adobe Premiere Pro
■ 音楽生成
- Udio(Rapパート)
■ 音楽制作(DAW・素材)
- Apple Logic Pro
- Splice
- SoundID VoiceAI(Rapパート)
その他、細かいツールも併用していますが、メインのワークフローは以上の通りです。
詳細な制作工程については後日改めてまとめようと思いますが、今回は制作中に直面した最大のハードルについて触れておきます。それは、1:26あたりに登場する「子供たち」の生成です。
ご存知の方も多いかと思いますが、現在のクラウド型動画生成AIでは、安全性の観点から未成年者の描写に対して非常に厳しい規制(セーフティフィルター)が設けられています。 上記のような単なる和やかなシーンであっても「センシティブなコンテンツ」として誤検知されてしまい、Google Veoはもちろんのこと、Kling AIやOpenAI Soraといった主要なサービスでは生成自体がストップしてしまいました。
そこで解決策として、検閲の入らないローカル環境での生成を決断。ComfyUIを導入し、手持ちのWindows機で生成を試みましたが…僕のPCスペックはVRAM 6GB。動画生成を行うにはあまりに過酷な環境だったため、生成にはとてつもない時間を要することになりました。
そういえば以前から「どうしても生成できないカットがある」と疑問に思っていたのですが、改めて振り返ると、それらには明確な共通点がありました。
例えば、
- 「お母さんが食べるカレーを羨ましそうに見つめる少女」
- 「転んで膝を擦りむいた少年」
これらはすべて、「子供」が関わるシーンだったわけです。
昨今、AIによるハイクオリティなVコンテ制作が可能になり、「将来的にはAIだけで映画が作れるようになる」とさえ言われています。しかし、物語を描く上で非常に重要な要素である「子供」が登場するシーンを作れないとなると、それは映像制作において極めて大きなボトルネックとなりますよね。
プラットフォーム側の規制(セーフティフィルター)と、クリエイターが求める表現の自由。 技術は進化していますが、この課題は将来的にどのような形で解決、あるいは共存していくことになるのでしょうか…?
🎙️