Command Palette
Search for a command to run...
UserLM-8b:用户对话模拟模型
一、教程简介
UserLM-8b 是微软于 2025 年 10 月发布的用户行为模拟模型。与在对话中扮演「助手」角色的典型 LLM 不同,UserLM-8b 是用来模拟对话中的「用户」角色(基于 WildChat 对话语料库训练),可以用于大模型助手能力评估。该模型并非常见的大模型助手,不能模拟更真实的对话或者解决问题,但该模型有助于开发更强大的助手。相关论文成果为「Flipping the Dialogue: Training and Evaluating User Language Models」。
该教程算力资源采用双卡 RTX 5090 。
二、效果示例

三、运行步骤
1. 启动容器

2. 进入网页后,即可与模型展开对话
若显示「Bad Gateway」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面。
使用步骤

四、交流探讨
🖌️ 如果大家看到优质项目,欢迎后台留言推荐!另外,我们还建立了教程交流群,欢迎小伙伴们扫码备注【SD 教程】入群探讨各类技术问题、分享应用效果↓

引用信息
@inproceedings{naous2025flipping,
title={Flipping the Dialogue: Training and Evaluating User Language Models},
author={Tarek Naous and Philippe Laban and Wei Xu and Jennifer Neville},
journal={arXiv preprint arXiv:2510.06552},
year={2025},
url={https://arxiv.org/abs/2510.06552}
}