该教程为 LGM 的 Demo 实现。 LGM,即 Large Multi-View Gaussian Model(大型多视角高斯模型),是一种创新的框架,用于从文本提示或单视图图像生成高分辨率的 3D 模型。由来自北京大学、南洋理工大学 S-Lab 和上海人工智能实验室的研究者在论文「LGM: Large Multi-View Gaussian Model for High-Resolution 3D Content Creation」中提出。 LGM 框架通过多视角高斯特征作为 3D 表示,并使用非对称 U-Net 作为骨干网络,实现了高保真度和高效的 3D 模型生成。该方法能够在 5 秒内生成 3D 对象,并将训练分辨率提升至 512,从而实现高分辨率的 3D 内容生成。
1. 克隆教程容器并成功启动后,按照下图指引进入操作页面:
2. 上传图片/输入提示词/两者混合输入得到生成 3D 展示效果:
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓