教程简介

该教程至少需要 NVIDIA RTX A6000 48GB 启动。

Allegro 是由 Rhymes AI 于 2024 年研发的尖端文本至视频生成模型，具备将基础文本输入转化为高清晰度视频内容的能力，具体表现为 720p 分辨率、每秒 15 帧的流畅度以及最长 6 秒的视频长度。相关论文成果为 Allegro: Open the Black Box of Commercial-Level Video Generation Model 。该模型在视频合成领域内展现出卓越的性能，其在质量和时间连贯性方面均表现优异。它能够迅速根据描述性文本生成动态视觉内容，为内容创作者提供了一种既灵活又可控的视频创作途径。在用户研究中，Allegro 模型展现出的性能超越了现有的开源模型以及大多数商业模型。此外，Allegro 还提供了包括模型扩展、提示精炼适应性以及视频分词器设计在内的增强基础能力的深入见解和指导。这些增强功能共同提升了模型的能力，使其能够根据输入文本的叙事细节生成复杂的视频内容。

该教程为模型推理教程，由于模型生成视频耗时较长，本教程仅可生成 5 秒视频（耗时约 40 分钟）。

运行步骤

克隆启动容器后点击 API 地址即可进入 Web 界面

1. 文字生成视频

输入文本提示词，点击 Submit（启动时会有大概 30s 左右的模型加载时间，之后显示进度条，开始生成视频，生成一段五秒的视频大概需要 40 分钟左右，请大家耐心等待）

如下图所示

当视频生成完成，进度条会自动变为视频进行播放

如下图所示

2. 视频下载

点击视频右的侧下载按键，即可下载视频。

如下图所示

HyperAI

运行此教程在 Discord 上讨论

日期

1 年前

大小

291.26 MB

标签

GitHub

论文 URL

教程简介

该教程至少需要 NVIDIA RTX A6000 48GB 启动。

该教程为模型推理教程，由于模型生成视频耗时较长，本教程仅可生成 5 秒视频（耗时约 40 分钟）。

运行步骤

克隆启动容器后点击 API 地址即可进入 Web 界面

1. 文字生成视频

输入文本提示词，点击 Submit（启动时会有大概 30s 左右的模型加载时间，之后显示进度条，开始生成视频，生成一段五秒的视频大概需要 40 分钟左右，请大家耐心等待）

如下图所示

当视频生成完成，进度条会自动变为视频进行播放

如下图所示

2. 视频下载

点击视频右的侧下载按键，即可下载视频。

如下图所示

交流探讨

🖌️ 如果大家看到优质项目，欢迎后台留言推荐！另外，我们还建立了教程交流群，欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

HyperAI

运行此教程在 Discord 上讨论

日期

1 年前

大小

291.26 MB

标签

GitHub

论文 URL

教程简介

该教程至少需要 NVIDIA RTX A6000 48GB 启动。

该教程为模型推理教程，由于模型生成视频耗时较长，本教程仅可生成 5 秒视频（耗时约 40 分钟）。

运行步骤

克隆启动容器后点击 API 地址即可进入 Web 界面

1. 文字生成视频

输入文本提示词，点击 Submit（启动时会有大概 30s 左右的模型加载时间，之后显示进度条，开始生成视频，生成一段五秒的视频大概需要 40 分钟左右，请大家耐心等待）

如下图所示

当视频生成完成，进度条会自动变为视频进行播放

如下图所示

2. 视频下载

点击视频右的侧下载按键，即可下载视频。

如下图所示

交流探讨

该教程由社区用户贡献，仅供交流学习使用。如内容涉及侵权，请联系邮箱 [email protected] 以便及时审查和下架。

F5-E2 TTS 只需 3 秒克隆任何音色

2 个月前

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

20 天前

TRELLIS.2 3D 生成 Demo

19 天前

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

3 个月前

Krea-realtime-video：实时视频生成模型

3 个月前

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

1 个月前

Docling：文档解析神器

2 个月前

一键部署 Ministral-3-14B-Instruct

2 个月前

DiffVox：声音区分效果模型

2 个月前

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

Allegro 视频生成 Demo

教程简介

运行步骤

1. 文字生成视频

2. 视频下载

交流探讨

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Allegro 视频生成 Demo

教程简介

运行步骤

1. 文字生成视频

2. 视频下载

交流探讨

相关教程

F5-E2 TTS 只需 3 秒克隆任何音色

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

Krea-realtime-video：实时视频生成模型

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

Docling：文档解析神器

一键部署 Ministral-3-14B-Instruct

DiffVox：声音区分效果模型

用 AI 构建 AI

HyperAI Newsletters

Command Palette

Allegro 视频生成 Demo

教程简介

运行步骤

1. 文字生成视频

2. 视频下载

交流探讨

相关教程

F5-E2 TTS 只需 3 秒克隆任何音色

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

Krea-realtime-video：实时视频生成模型

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

Docling：文档解析神器

一键部署 Ministral-3-14B-Instruct

DiffVox：声音区分效果模型

用 AI 构建 AI

HyperAI Newsletters

相关教程

F5-E2 TTS 只需 3 秒克隆任何音色

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

Krea-realtime-video：实时视频生成模型

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

Docling：文档解析神器

一键部署 Ministral-3-14B-Instruct

DiffVox：声音区分效果模型

相关教程

F5-E2 TTS 只需 3 秒克隆任何音色

Nemotron-Speech-Streaming-ASR：自动语音识别 Demo

TRELLIS.2 3D 生成 Demo

MonkeyOCR：基于结构-识别-关系三元组范式的文档解析

Krea-realtime-video：实时视频生成模型

Kiss3DGen：基于图像扩散模型的 3D 资产生成框架

Docling：文档解析神器

一键部署 Ministral-3-14B-Instruct

DiffVox：声音区分效果模型