HyperAI超神经
Back to Headlines

谷歌开放Veo 3 AI视频生成器公共测试版:如何体验同步音视频创作神器

4 days ago

Google最新发布的Veo 3 AI视频生成器已经在互联网上引起了广泛讨论。该公司于本周四宣布,Veo 3现面向所有用户开放公共预览,包括所有Google Cloud客户和合作伙伴,他们可以在Vertex AI Media Studio中访问该工具。最初,Veo 3仅限Gemini Ultra订阅者和通过Google的AI赋能电影制作平台Flow使用。Veo 3的核心功能在于能够同步生成视频和音频,这是此前一直困扰行业的技术难题。例如,用户可以要求系统生成一段繁忙地铁车厢内的视频,Veo 3不仅能生成视频,还能添加AI生成的背景噪音,甚至模拟人类对话声音,从而增强视频的真实感。 Veo 3在真实世界的物理仿真方面表现出色,能够精确模拟水的流动和光影的变化等细节,这使得它成为电影制作人的有力助手,也推动了Google在创意产业中普及可用AI技术的使命。用户可以通过自然语言文本提示来创建视频,并且可以通过细化指令来微调创作细节,如天空的颜色或午后阳光照射水面的方式。目前,一些公司正在积极试用Veo 3,以生成面向客户的社交媒体广告、产品演示视频,以及内部使用的培训视频。 创意专业人士对Veo 3的反应不一。知名导演Darren Aronofsky与Google DeepMind建立了创意合作伙伴关系,看好AI辅助电影制作的未来潜力。相反,一些娱乐行业工会认为AI生成视频的广泛应用将威胁到他们的工作和利益,因此正在组织行动以保护自己的职位。尽管存在批评,技术公司仍在不断推出新的视频生成工具供市场营销人员使用。例如,Amazon Ads上个月在美国全面发布了其Video Generation工具;而Meta则进一步计划实现广告制作的全自动化过程。 Veo 3是大型科技公司开发的首批能够同步生成视频和音频的模型之一。Meta的Movie Gen在去年10月发布,也是这一领域的尝试。其他工具,如Runway的Gen-3 Alpha,虽然也能在后期处理中实现视频与AI生成音频的融合,但无法像Veo 3那样在同一过程中完成。同步生成视频和音频的技术不仅需要处理视频的帧序列与音频的连续波之间的不同时间尺度,还需要动态调整材料、距离和速度等因素,从而使音视频效果更加真实。 业内人士认为,Veo 3的推出标志着AI在创意应用领域的一个重大飞跃,尤其是在广告行业。Google在AI领域的持续投资,不仅展示了其强大的技术实力,也为未来的多媒体内容创作提供了新的可能性。然而,这也引发了业内关于AI技术将如何影响传统职业角色和创作流程的讨论。

Related Links