HyperAIHyperAI

Command Palette

Search for a command to run...

LegoGPT:用文字创造稳定且多彩的乐高模型

近日,科研团队推出了一款全新的基于文本生成乐高设计的AI工具——LegoGPT。这款工具能够根据用户提供的文字描述自动生成乐高积木搭建方案,生成的设计不仅具有高度的物理稳定性,而且还便于实际搭建,满足了长期以来乐高爱好者和设计师们的需求。 为了实现这一目标,研究人员构建了一个大规模的乐高设计数据库,该数据库包含了超过47,000个乐高结构及详细的文字说明。这些结构涉及超过28,000种独特的3D物体,并且每一个都是经过物理验证和稳定性测试的。研究人员训练了一个基于大型语言模型(LLM)的自回归模型,通过“下一个令牌预测”算法来决定每一步应该添加哪一块积木,这一过程可以理解为模型预测下一步最合适的积木类型和位置。 为了提高生成设计的稳定性,研究团队在生成过程中加入了一个高效的合法性检查机制和物理感知回滚策略。这一机制能够在每一步生成时,利用物理学原理和组装约束剔除不合理的积木选择。实验结果显示,LegoGPT生成的乐高作品不仅稳定性强,而且风格多样、美观性好,与用户输入的文字提示高度一致。 此外,研究人员还开发了一种基于文本的乐高上色方法,可以根据文字提示生成带有颜色和纹理效果的乐高设计。实验表明,这些设计既可以由人类手动拼装完成,也能够通过机械臂自动搭建,极大地方便了实际应用。 值得一提的是,团队不仅对外发布了LegoGPT模型及其源代码,还开放了他们的数据库StableText2Lego,供其他研究人员和爱好者使用。该数据库不仅涵盖了大量物理稳定的乐高设计,还包括详细的设计说明,有助于推动相关领域的进一步发展和创新。

相关链接