Command Palette
Search for a command to run...
Lufan Chang

摘要
大型语言模型(LLMs)在生成真正创新的想法方面常常面临挑战,通常只会倾向于训练数据中“引力井”内的高概率、熟悉概念。尽管先进的基于搜索的方法(如思维树,Tree of Thoughts, ToT)试图缓解这一问题,但其本质仍受限于依赖非原则性、不一致的自我评估启发式策略来引导探索过程。为填补这一空白,我们提出了Magellan——一种全新的框架,将创造性生成重新定义为对语言模型潜在概念空间的有原则、受引导的探索。该框架的核心是基于分层引导机制的蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)。在长程方向引导方面,采用正交投影构建的“语义罗盘”向量,引导搜索朝着具有相关性的新颖方向前进;在局部、逐步的决策层面,则引入一种感知环境的价值函数,取代存在缺陷的自我评估机制,构建明确的奖励结构,以平衡内在一致性、外部新颖性与叙事进展性。大量实验表明,Magellan 在生成具有更高可信度与创新性的科学设想方面,显著优于多个强大基线模型,包括 ReAct 和 ToT。我们的研究证明,在创造性发现过程中,有原则的引导式搜索比无约束的自主探索更为有效,为大型语言模型成为更具创新能力的协作伙伴开辟了新路径。