HyperAI超神经
2 days ago

基于LLM的对话AI用户模拟器中的目标对齐

Shuhaib Mehri; Xiaocheng Yang; Takyoung Kim; Gokhan Tur; Shikib Mehri; Dilek Hakkani-Tür
摘要

用户模拟器在对话式人工智能中至关重要,能够通过模拟交互实现智能体的可扩展开发与评估。尽管当前的大语言模型(LLMs)已具备较强的用户模拟能力,但我们发现,它们在多轮对话中难以持续展现出以目标为导向的行为——这一关键局限性严重影响了其在下游应用中的可靠性。为此,我们提出用户目标状态追踪(User Goal State Tracking, UGST)框架,用于在对话过程中持续追踪用户目标的演进状态。基于UGST,我们构建了一套三阶段方法论,用于开发能够自主追踪目标进展并推理生成与目标一致响应的用户模拟器。此外,我们建立了全面的评估指标体系,用于衡量用户模拟器在目标对齐方面的表现,并在两个基准测试(MultiWOZ 2.4 和 τ-Bench)中验证了所提方法的显著提升效果。本研究填补了对话式人工智能领域的一项关键空白,确立了UGST作为构建目标对齐型用户模拟器的核心框架。