Googleが発表したVeo 3.1、リアルな物理表現と顔の感情表現が大幅向上
GoogleがAI動画生成モデル「Veo 3.1」をリリースした。これは前バージョンに対する段階的な進化であり、リアルさの向上、音声の質の改善、複数フレームの参照機能、動画の延長機能といった重要な改良が加えられている。特に注目すべきは、物理現象の再現性と表情の自然さの飛躍的向上だ。 Veo 3.1は、流体の動きや人体の動きをより現実的に描く能力を備えている。たとえば、「プールの縁から女性が完璧なバックフリップをし、水に飛び込む瞬間」をプロンプトにした場合、水しぶきの飛散や水面の波紋、反射が従来のモデルと比べて極めて自然に再現されている。身体の動きも不自然な歪みがなく、物理法則に沿った正確な動作が実現している。また、背景音声との同期も完璧で、臨場感が大幅に高まっている。 顔の表情表現も大きく進化した。Veo 3.1では、参考画像を用いて人物の表情変化を細かく制御できる。例えば「中立から眉をひそめ、叫び、そして爆笑する」というプロンプトを入力すると、目が見開かれ、口が大きく開き、感情の変化が非常にリアルに再現される。これは演技シーンやキャラクターの感情表現の試作に非常に有効だ。 さらに新機能として「Ingredients to Video」が導入された。これは人物や衣装、スタイルなどの参考画像を複数登録し、それらを統一した視覚的要素として動画生成に活用できる仕組みだ。たとえば「黒のダウンジャケットとサングラスを着たアジア系男性がスタジオでファッション撮影を行う」というプロンプトに、参考画像を組み合わせることで、ジャケットやサングラスの形状、人物の姿勢、カメラの動きが一貫して維持された、プロフェッショナルな仕上がりの動画が生成できる。 このほか、低コスト・高速版の「Veo 3.1 Fast」も提供されており、Google AI StudioやVertex AI、Google Flow、Fal AI、Replicateなどのプラットフォームでも利用可能。現在、Pollo AIでは50%割引キャンペーン中で、実際の試用が容易になっている。 まとめると、Veo 3.1は大きな変革ではなくても、リアルさと制御性の向上により、コンテンツ制作やプロダクトプロモーションの現場に大きな影響を与える可能性を持つ。AI動画の実用化がさらに加速している。
