HyperAI超神经

Lightricks旗下LTX Studio发布了最新开源视频生成模型LTX-Video13B，成为行业的一大亮点。这款模型基于130亿参数，利用创新的多尺度渲染技术，实现了30倍于同类模型的生成速度，并在消费级GPU上表现优异。LTX-Video13B能够生成高分辨率、高帧率的视频，具备强大的创作控制能力和灵活的应用场景。 LTX-Video13B的核心技术在于多尺度渲染。它首先以低分辨率生成视频的粗略运动和场景布局，然后再逐步细化细节，从而显著提高生成速度和保持高质量输出。该技术使模型在渲染5秒视频时仅需2秒，且在如NVIDIA RTX4090的消费级GPU上运行流畅。相比传统的高分辨率模型，LTX-Video13B的内存需求更低，为创作者提供了更加高效的工作体验。 LTX-Video13B不仅在生成速度上领先，还在动作连贯性、场景结构和镜头关系理解方面表现出色。它支持多种视频生成模式，包括文本到视频、图像到视频和视频到视频。通过关键帧控制、角色与镜头运动调整以及多镜头组合等功能，创作者可以精细地控制每个细节，实现电影般的视觉效果。此外，模型还提供了视频延展和风格/动作替换功能，将现有视频延长至最长60秒，或将现实场景转换为动画风格，大大提升了视频内容的多样性和创造力。 LTX-Video13B的开源特性使其在GitHub和Hugging Face上免费提供，允许开发者和创作者自由修改和定制。Lightricks还推出了LTX-Video-Trainer工具，支持2B和13B模型的完整微调和LoRA训练，方便用户开发特定的控制模型。模型兼容ComfyUI工作流，新增的Looping Sampler节点能够生成任意长度的视频，确保运动的一致性。为了降低使用门槛，Lightricks发布了一系列辅助工具，包括适用于低内存设备的8位量化版本（ltxv-13b-fp8）和IC-LoRA Detailer。这些工具不仅提高了模型的适应性，还展示了Lightricks对AI技术普及化的坚定承诺。 LTX-Video13B对初创企业和年收入低于1000万美元的组织免费开放，旨在降低AI工具的使用成本，促进技术的广泛应用。目前，该模型已集成至LTX Studio平台，用户可以通过官方网站或GitHub获取模型及相关文档。Lightricks表示，未来将继续优化模型，开发更多控制类型和多模态功能，为创作者提供更多工具。 AIbase认为，LTX-Video13B的发布标志着开源视频生成技术的一次巨大飞跃。其多尺度渲染技术和对消费级硬件的优化，不仅打破了传统AI视频生成的设备限制，也为中小型团队和个人创作者提供了专业级别的创作工具。结合开源社区的协作，LTX-Video13B有望在影视、游戏、广告和教育等多个领域推动技术的进一步创新。 Lightricks是一家专注于图像和视频处理的AI技术公司，成立于2011年。该公司以其创新的消费级应用而闻名，如Facetune和Enlight，帮助数百万用户改进照片和视频质量。LTX-Video13B的推出再次证明了Lightricks在AI领域的领先地位和对技术普及的不懈追求。Lightricks计划在未来继续探索时间变化提示和多模态生成，以支持更复杂的创作需求。他们相信，随着更多开发者和创作者的加入，LTX-Video13B将成为AI视频生成领域的一个重要里程碑，开启视频创作的新篇章。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

LTX-Video 13B：30倍速生成高清视频，开源AI助力创作自由

相关链接

Command Palette

LTX-Video 13B：30倍速生成高清视频，开源AI助力创作自由

相关链接

Command Palette

LTX-Video 13B：30倍速生成高清视频，开源AI助力创作自由

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟