4 个月前

摘要

大型语言模型（LLMs）在生成真正创新的想法方面常常面临挑战，通常只会倾向于训练数据中“引力井”内的高概率、熟悉概念。尽管先进的基于搜索的方法（如思维树，Tree of Thoughts, ToT）试图缓解这一问题，但其本质仍受限于依赖非原则性、不一致的自我评估启发式策略来引导探索过程。为填补这一空白，我们提出了Magellan——一种全新的框架，将创造性生成重新定义为对语言模型潜在概念空间的有原则、受引导的探索。该框架的核心是基于分层引导机制的蒙特卡洛树搜索（Monte Carlo Tree Search, MCTS）。在长程方向引导方面，采用正交投影构建的“语义罗盘”向量，引导搜索朝着具有相关性的新颖方向前进；在局部、逐步的决策层面，则引入一种感知环境的价值函数，取代存在缺陷的自我评估机制，构建明确的奖励结构，以平衡内在一致性、外部新颖性与叙事进展性。大量实验表明，Magellan 在生成具有更高可信度与创新性的科学设想方面，显著优于多个强大基线模型，包括 ReAct 和 ToT。我们的研究证明，在创造性发现过程中，有原则的引导式搜索比无约束的自主探索更为有效，为大型语言模型成为更具创新能力的协作伙伴开辟了新路径。

源 PDF