GoogleのVeo 3 AIビデオジェネレーターが一般公開へ - 同期音声付き映像生成の新時代
GoogleのVeo 3 AI動画生成ツールがついに公開预览版で全ユーザー向けに提供開始 2023年に初公開され、以来インターネット上で話題となったGoogleの新しい動画生成モデル「Veo 3」が、9月18日に全面的な一般公開预览版で利用可能となりました。このツールは当初、Gemini UltraのサブスクリプターやGoogleのAIフィルミングプラットフォーム「Flow」のユーザーだけが使用できましたが、現在はGoogle Cloudのすべての顧客とパートナーが「Vertex AI Media Studio」からアクセスできるようになりました。 Veo 3は、テキストによる自然言語提示に基づいて動画を生成し、同期的な音声を付加できる特徴を持っています。これにより、たとえば混雑した地下鉄の中で動画を制作する場合、システムはAIによって生成された環境音や人の声を入れて、リアルさを高めることができます。さらに、水の流動や影の動きといった現実世界の物理法則をリアルに再現することで、映画制作や広告産業において重要なツールとなっております。 ユーザーは、空の色や午後の日光が水面上にどのように反射するかなどの微妙なディテールまで、指示を微調整しながら動画を作成できます。Googleは、各種企業がVeo 3を利用して顧客向けコンテンツ(ソーシャルメディア広告や製品デモ)や内部資料(トレーニングビデオ)を制作していると述べています。あるCEOは、「Veo 3は、実用的なAIが主流になった2023年以来、広告業界で最も大きな進歩をもたらすツール」と評価しています。 広告産業での利用と課題 Veo 3の動画と音声の同期生成能力は、AI動画生成技術が映像制作における実用的な用途を示す初期の例の一つです。例えば、Synthesia社は、AIを使って企業コンテンツの制作を迅速化し、リソースを削減するテクノロジーを提供してきました。 一方で、AI生成動画の普及には懐疑的な見方もあります。「OpenAIのSora」を使用したToys R' Usの広告が昨年、オンライン上で酷評されたのがその一例です。エンターテイメント業界の労働者が自身の職を守るために組織化される動きも出ています。 テック企業は引き続きマーケター向けの新たな動画生成ツールを発表しています。Amazon Adsは今月初め、米国全体での動画生成ツールの一般利用を開始しました。Metaはさらなる一歩を迈進し、広告制作プロセスの全段階を自動化する計画を持っているとのこと。 技術的なチャレンジ AIによる動画と音声の同時生成は、非常に複雑な技術的課題です。動画は静止画の連続であるのに対し、音声は連続的な波形であり、両者の同期は異なる時間軸の処理を必要とします。また、素材、距離、速度などの変数が動的に変化することも考慮しなければなりません。これらを実現するためには、Googleのような大手テック企業の持つ多大なコンピューティング資源が不可欠です。 業界の反応とGoogleの取り組み Veo 3の発表は、AIが映像制作において実用的な進歩を遂げていることを示しています。映画監督のダレン・アロノフスキーはGoogle DeepMindとの創造的なパートナーシップを結び、AIの可能性を探求しています。一方、ランウェイ社とライオンズゲートとの提携も、同様に注目されています。Googleは、映像制作の未来を切り開くために、より多くのクリエイターや映像産業関係者がAIを活用できるよう尽力しています。