動画生成AI「シリーズ・世界の〈分かってる〉ひと」（※生成方法等の詳細は概要欄をご確認ください）

Подписаться 3,2 тыс.

Просмотров 2,4 тыс.

50% 1

今回はArtListのVoiceoverに新たに加わった機能「フランス語」「スペイン語」「ドイツ語」の音声作成と、それを使ってのリップシンクのテストです。
手順としては、まず日本語の台詞をGoogle翻訳で各語に変換。ArtListのVoiceoverに追加された「各語の項目」を選択し、性別とキャラクターを決め、さきほどの翻訳文をコピペし、しゃべらせます。（この段階で10秒に収まるかどうか確認し、極端にオーバーするようなら最初の手順に戻り、日本語の台詞を縮めて再翻訳させたものでリトライします。なぜ10秒かというと、Runway GEN-3で生成できる動画の尺が、現状では5秒か10秒の二択になるからです）
狙い通りの音声が仕上がったらmp3データを書き出しておきます。
そのうえで各語のインタビュー動画のベースになる画像をAdobe Fireflyで生成します。
このとき人物像（性別、年齢、雰囲気）と共に「街頭インタビューである」こと、背景は「各国の街並みであること」も指示しておきます。
（インタビュアーを入れ込みたいカットに関してはその旨も記します。例えば「紺のスーツを着た男性インタビュアーの肩ナメ（もしくはOTS）」といった具合に。ちなみにOTSというのはOver The Shoulderの略で映像用語です）
欲しいイメージの画像が生成されたらRunway GEN-3のimage to videoにドロップし、10秒の動画を生成します。無事に生成されたらLipsyncボタンを押し、取り込み画面の用意が出来たら、さきに用意してあった各語のインタビュー音声（mp3）をドロップし、Lipsync動画を生成。
完成した動画をダウンロードしてDaVinci Resolveで編集・字幕入れ・SE及びエアノイズ追加・グレーディング等をして完成です。
※エアノイズはArtListから街頭関係のSEを、質問画面につけたタッチ音はフリー素材の効果音を使用しました。
ちょっとミスったのは、スペインの「ブルボン好きの女性」の音声（台詞）がわずかに12秒に達しており、最後の部分で動画が逆戻りしてしまったことです。どうやら11秒台まではギリギリ10秒扱いしてくれる（のりしろの範疇に収まる）ようですが、12秒台にタッチするとこういうことになるんですね……。
あと、ドイツの「ビルガモ推し」の女性のまばたきがちょっと破綻してるのが気になりますが、テスト内容とは別問題なので今回は良しとしました。
#動画生成ai
#runwaygen3
#ai動画

Кино