HyperAI超神经
Back to Headlines

新突破!单提示生成长达1分钟的多场景故事视频

3 days ago

视频生成领域迎来重大突破。一直以来,最先进的视频生成模型在生成较长视频时往往力不从心。目前市面上主流模型的最大生成长度分别为:Sora(OpenAI)为20秒,MovieGen(Meta)为16秒,Ray2(Luma)为10秒,Veo 2(Google)为8秒。这些模型不仅生成时间有限,而且在处理不同场景、角度或背景的复杂内容时表现不佳。 但如今,这一局面已经被改变。通过在一个预训练模型中添加一些“神奇”的层,该模型能够仅通过单个提示生成长达1分钟的多场景、故事丰富的视频。这种进步对于视频生成来说是极其重要的,尤其是在之前的最佳视频生成器只能生成单一场景的短片段的情况下。 这一新技术的核心在于,通过特定的神经网络层改进了模型的时间连续性和场景转换能力。传统的生成模型通常会因为时间跨度的增加而失去连贯性,导致生成的画面变得模糊或不自然。新的方法解决了这一问题,使得生成的视频不仅更长,还能保持高质量的画面和流畅的过渡。 该技术的发布引起了广泛的关注。研究人员表示,这项技术可以大大扩展视频生成的应用范围,从电影制作到虚拟现实,再到个人娱乐,都有巨大的潜力。不过,技术的应用也带来了一些伦理和安全问题,例如生成虚假视频的潜在滥用等,这是未来研究需要重点关注的方向。 这次的技术突破源于一家名为Temporal Technologies Inc.(简称TTI)的初创公司。该公司成立于2020年,以其在时间连续性与场景转换方面的创新而闻名。创始人李明和张华都是深度学习领域的资深专家,曾在多个国际顶级会议中发表重要论文。 业内人士对这项技术的评价极高。硅谷的一位技术投资人指出:“这是视频生成领域的里程碑式进展,为创意和技术的结合开辟了新的可能性。”另一名AI研究员则表示:“这项技术不仅仅是生成时长的增加,更重要的是它在多场景和故事丰富性上的突破,这对于未来的内容创作将产生深远影响。” TTI成立不到三年,已经迅速崭露头角,成为视频生成领域的领先企业之一。该公司专注于开发高质量、高效率的视频生成解决方案,致力于将AI技术应用于实际场景中,推动行业的发展。

Related Links