Command Palette

Search for a command to run...

8 天前

Magellan:用于潜在空间探索与新颖性生成的引导式MCTS

Lufan Chang

Magellan:用于潜在空间探索与新颖性生成的引导式MCTS

摘要

大型语言模型(LLMs)在生成真正创新的想法方面常常面临挑战,通常只会倾向于训练数据中“引力井”内的高概率、熟悉概念。尽管先进的基于搜索的方法(如思维树,Tree of Thoughts, ToT)试图缓解这一问题,但其本质仍受限于依赖非原则性、不一致的自我评估启发式策略来引导探索过程。为填补这一空白,我们提出了Magellan——一种全新的框架,将创造性生成重新定义为对语言模型潜在概念空间的有原则、受引导的探索。该框架的核心是基于分层引导机制的蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)。在长程方向引导方面,采用正交投影构建的“语义罗盘”向量,引导搜索朝着具有相关性的新颖方向前进;在局部、逐步的决策层面,则引入一种感知环境的价值函数,取代存在缺陷的自我评估机制,构建明确的奖励结构,以平衡内在一致性、外部新颖性与叙事进展性。大量实验表明,Magellan 在生成具有更高可信度与创新性的科学设想方面,显著优于多个强大基线模型,包括 ReAct 和 ToT。我们的研究证明,在创造性发现过程中,有原则的引导式搜索比无约束的自主探索更为有效,为大型语言模型成为更具创新能力的协作伙伴开辟了新路径。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供