Command Palette

Search for a command to run...

自然语言强化学习 NLRL

日期

1 年前

自然语言强化学习(NLRL,全称为 Natural Language Reinforcement Learning)是一个由伦敦大学学院、上海交通大学、布朗大学、布里斯托大学、新加坡国立大学以及萨里大学的研究者于 2024 年提出的全新强化学习框架,相关论文成果为「Natural Language Reinforcement Learning」。

NLRL 的核心思想是将强化学习 (RL) 的核心概念,包括任务目标、策略、价值函数、贝尔曼方程和策略迭代,类比为基于自然语言的形式,从而开辟了一条通向更智能、更自然的 AI 决策学习的新道路。这种方法创新性地将 RL 原则重新定义为语言对应物,使得 AI 系统能够通过与环境的交互来学习,而不依赖任何人类标注数据。

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供