HyperAI

麻省理工学院（MIT）的研究团队开发了一款名为SketchAgent的AI文生图工具，这款工具能够模拟人类的素描过程，并支持与用户的人机协作创作。研究人员在基于Web的协作式草图绘制环境中测试了该系统，让用户可以与SketchAgent轮流向画布上添加笔触，直到双方对最终的效果满意为止。系统中，绿色表示用户的笔触，红色则代表SketchAgent的绘制部分，而用户还可以通过对话来编辑调整这些草图。这一工具在处理多个概念组合时表现出了惊人的灵活性。例如，在删除某个人工笔触后，整幅船景草图就难以辨认。此外，SketchAgent还能够绘制一些非常抽象的概念图像，如机器人物、DNA双螺旋、流程图，甚至是一些戏剧场景。这表明它不仅具备一定的创作能力，而且对于复杂概念的图形化表现也有着独特的见解。研究人员在实验中发现，尽管SketchAgent展现出了巨大的潜力，但它目前仍无法完成专业的元素描述，例如绘制符号、短语、特写等复杂生物或特定人物形象的细节。在多人协作过程中，模型有时会犯错，比如画出具有两个大脑的怪物。Vinker解释说，这种错误可能源自于其“思维链”机制，即将绘图任务分解为多个步骤，可能导致误解用户对某一草图的部分需求。研究者们正在通过扩展模型组成数据来优化这些功能，希望能简化与多种语言模型的交互流程，提高SketchAgent处理复杂图形的能力。未来的计划还包括优化该工具与其他语言模型的协作体验，使其能在更简单的交互中产生高质量的概念图。尽管存在一些局限，但SketchAgent的这一成果已经证明了，通过逐步的人机合作，AI完全有可能采用接近人类的思维方式进行多模态的图像创作，进而实现更加和谐的设计目标。业内专家对这一项目给予了高度评价，认为它展示了AI与人类协同工作的可能性，尤其是在艺术和教育领域。SketchAgent的出现不仅为创意设计者提供了新的辅助手段，也为学术研究开辟了新方向。MIT作为世界顶级的研究机构，一直以来都在积极探索AI技术的发展和应用，此次项目的成功进一步巩固了其在全球AI研发领域的领先地位。

相关链接

相关链接

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

Command Palette

MIT团队开发新型AI绘图系统，模仿人类素描并支持互动创作

相关链接

Command Palette

MIT团队开发新型AI绘图系统，模仿人类素描并支持互动创作

相关链接

Command Palette

MIT团队开发新型AI绘图系统，模仿人类素描并支持互动创作

相关链接

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟

视觉真实之外：清华 WorldArena 全新评测体系揭示具身世界模型的能力鸿沟