視覚選好最適化でAIが映画カメラ軌道を生成
上海大学上海映画学院の李夢甜教授チーム(MAGIC Lab)は、このほどコンピュータビジョン分野の国際頂点会議ECCV2026にて、映画級カメラ軌道生成技術「VERTIGO」に関する論文を採用された。本研究は生成AIがテキストから3Dカメラ軌道を自動生成する際、従来の幾何学的最適化のみでは構図破綻や主役の画面外脱落といった美的欠陥が生じる課題に対し、人間監督の審美判断を統合する「視覚嗜好最適化」フレームワークを提案した。 VERTIGOは、リアルタイムレンダリングエンジンと視覚大規模言語モデルによるカメラ生成と監督評価の対話型フィードバックループを構築した。数値スコアリングに依存せず、生成映像を自然言語で記述した逆説明と撮影指示を意味空間で照合する循環意味評価機構を採用し、構図の微細な偏差を高精度に検出する。研究チームは12万本の軌道データと2160万フレームの高精度标注を含む独自データセットLenScriptを構築し、直接嗜好最適化DPOによる後処理学習を適用した。その結果、幾何学的精度を維持しつつ画面外脱落をほぼ解消し、映画監督や専門職を含むユーザー実験で構図・指示追従性・美的評価で顕著な優位性を示した。 本成果は、計算機による軌道計画と映画映像の美的基準を初めて直接的に結びつけ、AI映像生成を単なるパス最適化から高度な美学制御へ転換させた。AI映画プレヴィジュアライゼーション、短編ドラマやアニメーションの自動生成など、コンテンツ制作の試作コスト削減とワークフロー効率化に直結する。上海大学は本論文通過により、AI技術と映画芸術の融合研究において国際的注目を集め、技術実装のみならず創作本質を重視するAIと映画の融合研究の新パラダイムを提示した。
