无需人类干预,AI实现自主学习与深度思考
一种能够自主思考、无需人类干预即可解决问题的新型人工智能模型——DeepSeek-R1,近日在《自然》杂志发表的研究中引发关注。该模型由中国的DeepSeek AI公司研发,首次实现了AI在没有人类示范的情况下,通过自我探索完成复杂问题的推理。 传统AI模型在训练时依赖大量人类提供的解题步骤示例,这不仅耗时费力,还可能引入人类偏见。而DeepSeek团队采用了一种名为“强化学习”的方法,仅向模型提供最终答案是否正确的奖励信号,让其在试错中自行摸索出有效的解题策略。 在训练过程中,R1模型展现出惊人的自主性:它能主动检查自身推理过程,尝试多种解题路径,并在成功时强化有效策略,失败则自动规避。研究人员甚至观察到,模型在思考时会使用“wait”(稍等)等词语,表现出类似人类的反思行为。 该模型在数学、编程和科学难题上表现卓越。尤其在2024年美国邀请数学竞赛(AIME)中,R1取得了86.7%的准确率,远超以往依赖人类指导的模型,接近顶尖高中生水平。尽管仍存在一些问题,如在非英文提示下混用语言、过度复杂化简单问题,但研究团队认为,这些问题有望通过后续优化解决。 这一突破标志着AI正迈向真正自主的推理能力,未来有望催生更强大、更智能的自主系统,开启人工智能的新篇章。
