Runway新AI模型实现文本生成视频精准度新突破
Runway宣布其最新文本生成视频模型Gen-4.5在视觉准确性上实现突破,称其达到“前所未有的物理精度与视觉精细度”。该公司在周一发布的博客中表示,Gen-4.5能够生成更具电影感和高度真实的视频内容,甚至可能让观众难以分辨AI生成画面与真实影像之间的差异。 Runway强调,新模型在遵循用户提示方面表现更佳,可在不牺牲画质的前提下呈现复杂场景。AI生成的物体运动具备真实的重量感、惯性和作用力,液体流动也展现出符合物理规律的动态效果。此外,Gen-4.5在处理不同视觉风格方面表现更优,能稳定输出逼真的写实画面、艺术化风格以及电影级视觉效果。 尽管如此,模型仍存在一些局限,例如在物体恒常性(object permanence)和因果推理方面表现不足,可能出现逻辑错位,如门在有人触碰把手前就已打开。 目前,Gen-4.5正逐步向所有用户开放,其运行速度与效率与前代模型保持一致。与此同时,OpenAI也在加速推进视频生成技术。其Sora 2模型在9月发布时已显著提升物理模拟能力,负责人Bill Peebles表示,模型可精准模拟在水上做后空翻时的流体动力学与浮力表现。 Runway表示,Gen-4.5生成的写实画面已接近真实影像水平,细节丰富、真实自然,标志着AI视频生成技术迈向新阶段。
