Command Palette
Search for a command to run...
UserLM-8b: 사용자 대화 시뮬레이션 모델
1. 튜토리얼 소개
UserLM-8b는 마이크로소프트가 2025년 10월에 발표한 사용자 행동 시뮬레이션 모델입니다. 대화에서 "어시스턴트" 역할을 하는 일반적인 LLM과 달리, UserLM-8b는 WildChat 대화 코퍼스 학습을 기반으로 대화에서 "사용자" 역할을 시뮬레이션하는 데 사용되며, 대규모 어시스턴트의 역량을 평가하는 데 사용될 수 있습니다. 이 모델은 일반적인 대규모 어시스턴트가 아니므로 더욱 현실적인 대화를 시뮬레이션하거나 문제를 해결할 수는 없지만, 더욱 강력한 어시스턴트를 개발하는 데 도움이 될 수 있습니다. 관련 논문 결과는 다음과 같습니다.대화 뒤집기: 사용자 언어 모델 훈련 및 평가".
이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 5090 카드 두 개입니다.
2. 효과 예시

3. 작업 단계
1. 컨테이너를 시작하세요

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
사용 방법

인용 정보
@inproceedings{naous2025flipping,
title={Flipping the Dialogue: Training and Evaluating User Language Models},
author={Tarek Naous and Philippe Laban and Wei Xu and Jennifer Neville},
journal={arXiv preprint arXiv:2510.06552},
year={2025},
url={https://arxiv.org/abs/2510.06552}
}