HyperAI超神经
Back to Headlines

MIT与Adobe合作推出CausVid:实时生成高清晰度视频的新AI工具

2 months ago

麻省理工学院(MIT)与Adobe合作开发了一款名为CausVid的AI视频生成工具,旨在实现快速、高质量的视频生成。该团队在最近的一次实验中,成功生成了30秒钟的稳定高清视频,这在画质连贯性上与目前市场上的其他顶级视频生成模型如“OpenSORA”和“MovieGen”持平,但在生成速度上却快了约100倍,能够在短短10秒内产生高质量的视频片段。 这一技术突破基于用户对视频场景的简单描述,通过自然语言处理技术生成视频。研究者天巍音指出,这种模型的设计不仅考虑了自回归模型的速度优势,同时也兼顾了生成内容的质量和多样性。CausVid能够在保证极短生成周期的同时,输出最稳定、最高质量的视频片断。这一模型通过对900多次提示视频数据集进行性能测试,获得了84.27的综合评分,其在成像质量和人体动作模拟方面的表现尤为突出。 CausVid的成功并非偶然,背后是一系列关键技术的支撑。首先,该模型采用了特定领域的数据集进行训练,从而能够生产出更加符合机器和游戏产业需求的视频内容。此外,CausVid的混合架构结合了传统AI模型的优点,并通过简化因式结构大幅度提高了视频生成速度,实现了近乎实时的生成能力。这一特点使得CausVid在处理大量视频流时具有无可比拟的优势,为未来实时应用奠定了坚实的基础。 业内专家认为,CausVid混合AI系统是当前面临处理速度瓶颈的扩散模型的重要升级。朱俊言助理教授评论说:“现有的视频模型生成速度接近大语言模型或图像生成模型,这项工作显著提高了生成效率,意味着更流畅的交互速度、更强的互动应用潜力以及更低的成本开销。”此外,CausVid技术得到了亚马孙科学中心、光旦科学技术研究院、Adobe、谷歌、美国空军研究实验室及美国空军人工智能加速器等机构的支持。该研究成果将于6月在国际计算视觉与模式识别会议(CVPR)上正式展示。 MIT与Adobe的合作,标志着科技企业在推动AI技术发展的同时,也注重跨学科的合作与创新。两家公司在AI领域均拥有深厚的技术积淀和广泛的影响力,此次合作预示着未来在视频生成技术方面的更多可能性,有望为创意产业带来革命性的变化。

Related Links