HyperAI超神经

自然语言强化学习 NLRL

自然语言强化学习(NLRL,全称为 Natural Language Reinforcement Learning)是一个由伦敦大学学院、上海交通大学、布朗大学、布里斯托大学、新加坡国立大学以及萨里大学的研究者于 2024 年提出的全新强化学习框架,相关论文成果为「Natural Language Reinforcement Learning」。

NLRL 的核心思想是将强化学习 (RL) 的核心概念,包括任务目标、策略、价值函数、贝尔曼方程和策略迭代,类比为基于自然语言的形式,从而开辟了一条通向更智能、更自然的 AI 决策学习的新道路。这种方法创新性地将 RL 原则重新定义为语言对应物,使得 AI 系统能够通过与环境的交互来学习,而不依赖任何人类标注数据。