HyperAI超神经
Back to Headlines

LTX-Video 13B:30倍速生成高清视频,开源AI助力创作自由

8 days ago

Lightricks旗下LTX Studio发布了最新开源视频生成模型LTX-Video13B,成为行业的一大亮点。这款模型基于130亿参数,利用创新的多尺度渲染技术,实现了30倍于同类模型的生成速度,并在消费级GPU上表现优异。LTX-Video13B能够生成高分辨率、高帧率的视频,具备强大的创作控制能力和灵活的应用场景。 LTX-Video13B的核心技术在于多尺度渲染。它首先以低分辨率生成视频的粗略运动和场景布局,然后再逐步细化细节,从而显著提高生成速度和保持高质量输出。该技术使模型在渲染5秒视频时仅需2秒,且在如NVIDIA RTX4090的消费级GPU上运行流畅。相比传统的高分辨率模型,LTX-Video13B的内存需求更低,为创作者提供了更加高效的工作体验。 LTX-Video13B不仅在生成速度上领先,还在动作连贯性、场景结构和镜头关系理解方面表现出色。它支持多种视频生成模式,包括文本到视频、图像到视频和视频到视频。通过关键帧控制、角色与镜头运动调整以及多镜头组合等功能,创作者可以精细地控制每个细节,实现电影般的视觉效果。此外,模型还提供了视频延展和风格/动作替换功能,将现有视频延长至最长60秒,或将现实场景转换为动画风格,大大提升了视频内容的多样性和创造力。 LTX-Video13B的开源特性使其在GitHub和Hugging Face上免费提供,允许开发者和创作者自由修改和定制。Lightricks还推出了LTX-Video-Trainer工具,支持2B和13B模型的完整微调和LoRA训练,方便用户开发特定的控制模型。模型兼容ComfyUI工作流,新增的Looping Sampler节点能够生成任意长度的视频,确保运动的一致性。为了降低使用门槛,Lightricks发布了一系列辅助工具,包括适用于低内存设备的8位量化版本(ltxv-13b-fp8)和IC-LoRA Detailer。这些工具不仅提高了模型的适应性,还展示了Lightricks对AI技术普及化的坚定承诺。 LTX-Video13B对初创企业和年收入低于1000万美元的组织免费开放,旨在降低AI工具的使用成本,促进技术的广泛应用。目前,该模型已集成至LTX Studio平台,用户可以通过官方网站或GitHub获取模型及相关文档。Lightricks表示,未来将继续优化模型,开发更多控制类型和多模态功能,为创作者提供更多工具。 AIbase认为,LTX-Video13B的发布标志着开源视频生成技术的一次巨大飞跃。其多尺度渲染技术和对消费级硬件的优化,不仅打破了传统AI视频生成的设备限制,也为中小型团队和个人创作者提供了专业级别的创作工具。结合开源社区的协作,LTX-Video13B有望在影视、游戏、广告和教育等多个领域推动技术的进一步创新。 Lightricks是一家专注于图像和视频处理的AI技术公司,成立于2011年。该公司以其创新的消费级应用而闻名,如Facetune和Enlight,帮助数百万用户改进照片和视频质量。LTX-Video13B的推出再次证明了Lightricks在AI领域的领先地位和对技术普及的不懈追求。Lightricks计划在未来继续探索时间变化提示和多模态生成,以支持更复杂的创作需求。他们相信,随着更多开发者和创作者的加入,LTX-Video13B将成为AI视频生成领域的一个重要里程碑,开启视频创作的新篇章。

Related Links