近年、AI技術の進化により、映像制作の在り方が大きく変化しています。特にK-POPをはじめとするMV制作において、AIを活用したコンテンツが増えており、より高品質で個性的なビジュアルが追求されています。
生成AIを活用した映像制作のプロセスとその可能性について紹介します。
※2024年12月~2025年01月時点
目次
- 【まずは完成品から】
- 【MV制作におけるAIの活用】
- 1. 制作フローの検討
- 2. 曲名と楽曲生成
- 【AIによる動画生成の比較】
- 比較した動画生成AIツール
- AI生成品質の比較結果
- 【MVの世界観・ストーリー設定】
- 【MV制作における課題と対策案】
- 【MV制作の生成AIサービスコスト】
- 【まとめ】
【まずは完成品から】
https://www.youtube.com/watch?v=l5aE_rBQyfs
この楽曲とMVは全てAIで生成したものです。
解説していきます。
【MV制作におけるAIの活用】
1. 制作フローの検討
通常のMV制作における、一般的なフローは以下の通りです。
1.楽曲作成&分析
歌詞、メロディー、リズム、テンポを分析
2.ストーリー設定
MVのコンセプトや物語、キャラクター設定を決定
3.世界観設定
建築物、ファッション、カラーなどのリファレンスを集め、チームで統一感を持たせる
4.映像制作
カット割り、絵コンテ/Vコンテを作成し、動画生成後に編集を行う
今回のAI映像制作フローもおおよそ変わりはありませんが、以下の通り設定し、実行しました。
1.歌詞・楽曲生成
歌詞を生成後、SUNO AIで楽曲を生成
2.ストーリー+世界観設定
MVのコンセプトや物語、キャラクター設定を決定
建築物、ファッション、カラーなどPinterest等でリファレンス集め
必要があればMidjourneyで画像を生成する
3.映像制作
カット割りやコンテは作成せず、動画生成後に編集を行った
2. 曲名と楽曲生成
AIツール「SUNO」を使用し、ChatGPTより生成した歌詞を元にK-POP風の楽曲を作成。複数のバリエーションを比較し、最適な楽曲を選択し、音質の向上やステム分離には「Ultimate Vocal Remover」を活用しました。
曲名は”Echo7light”
※曲名はChatGPTにより命名
歌詞もChatGPTで制作
生成楽曲①
https://suno.com/song/5b8523c7-29e9-4eeb-be98-74c17b15cee2
生成楽曲②
https://suno.com/song/65480018-60cf-4c0b-a0cc-981a4060c5b8
生成楽曲③
https://suno.com/song/5b8523c7-29e9-4eeb-be98-74c17b15cee2
生成楽曲④
https://suno.com/song/8db05ac0-fda1-4e1f-a372-01d0eae366bb
生成楽曲⑤
https://suno.com/song/7e1eb66d-28c1-436e-a6f5-18fa05213902
最終候補①
https://suno.com/song/e51152ff-b13a-42f4-bb68-e491ba63cc44
最終候補② ※こちらを採用
https://suno.com/song/3f0ad17c-0a9f-4c4c-93e4-1f47ed17062b
【AIによる動画生成の比較】
比較した動画生成AIツール
・Runway(米国製の動画生成・編集ツール)
・Vidu AI(中国・清華大学が開発)
・Hailuo AI(中国MiniMax製)
・KLING(中国Kuaishou製)
AI生成品質の比較結果
・KLINGが最もMVらしい映像を生成。
・Runwayは背景の破綻が目立つ。
・Vidu AIはカメラワークが弱い。
・Hailuo AIは不安定で制御が難しい。
比較方法は下記の手順で行っています。
①Midjourneyにて元画像を作成
Midjourneyにて元画像を作成
②それぞれの動画サービスに、同じプロンプト、画像で入力する。
※各ツールのパラメータはデフォルト設定のまま使用
Freestyle dynamic camera movement: The camera moves fluidly around a silhouetted woman standing in front of sheer curtains, capturing dramatic lens flares as the sunlight streams through. The setting evokes a retro cinematic aesthetic with muted tones, soft light, and a nostalgic atmosphere. The woman’s delicate lace dress and her motionless, contemplative pose add an air of mystery. cinematic retro footage
③出力された映像を比較
※AIツールは試行回数を増やすことで精度が向上するが、コストがかかる点も考慮する必要がある。
https://www.youtube.com/watch?v=HdelB49aKYY
https://www.youtube.com/watch?v=TEoa5UDX7yg
https://www.youtube.com/watch?v=4DC37Tq19u4
https://www.youtube.com/watch?v=YNs0QTINJLg
https://www.youtube.com/watch?v=QEL49sSLEAU
https://www.youtube.com/watch?v=9ZG5EX0_TUU
https://www.youtube.com/watch?v=gqy3ryiFhD0
https://www.youtube.com/watch?v=6BGuSWsp3fQ
【MVの世界観・ストーリー設定】
AI映像制作では、Surreal(シュール)な世界観が人気だと思われる。(よく見る)
・楽曲に合わせてダークでクールな雰囲気を出すため、Midjourneyでリファレンス画像を生成
・KlingAIで動画生成&リップシンク調整
・シーンごとに試行錯誤しながら映像を制作
Midjourneyで生成したリファレンス画像
【MV制作における課題と対策案】
【課題】
・AIツールの依存度が高い → サーバーダウンなどで作業が停滞。
・カメラワークの指定が難しい → 静止画と異なり、動的な演出が不安定。
・試行回数によるコスト増加 → 生成クレジットが必要。
・細部のディテール表現が弱い → 衣装やブランド品の再現が難しい。
【解決策】
・複数のAIツールを組み合わせる → 依存リスクを分散。
・カメラワークを詳細に指定する → 絵コンテや、リファレンス画像を適切に検討。
・試行データを蓄積・共有 → 効率的な制作ワークフローを構築する。
【MV制作の生成AIサービスコスト】
ちなみに今回の検証でAI生成でかかった費用はこんな形。
Midjourney 5000円、SUNO 1500円、KlingAI 4500円、合計11,000円
これらを踏まえて、改めて完成品映像を見ていただきたい。
https://www.youtube.com/watch?v=l5aE_rBQyfs
【まとめ】
AIを活用した映像制作は、従来のMV制作に比べて低コストでありながら、高品質な映像を生み出す可能性を秘めています。ただし、特定のツールに依存しすぎるリスクや、AIの制約を理解した上での試行錯誤が求められると感じます。
カディンチェでは、今後もさらに進化するAI技術を活用し、映像制作や技術開発を含む様々な分野での新たな可能性を探求、調査していきます。