Command Palette
Search for a command to run...
UserLM-8b: 사용자 대화 시뮬레이션 모델
GPU 컴퓨팅 에어드롭
1. 튜토리얼 소개
UserLM-8b는 마이크로소프트가 2025년 10월에 출시한 사용자 행동 시뮬레이션 모델입니다. 대화에서 "비서" 역할을 하는 일반적인 LLM과 달리, UserLM-8b는 대화에서 "사용자" 역할을 시뮬레이션하도록 설계되었으며(WildChat 대화 코퍼스로 학습됨), 대규모 비서 모델의 성능을 평가하는 데 사용할 수 있습니다. 이 모델은 일반적인 대규모 비서 모델이 아니므로 보다 현실적인 대화나 문제 해결을 시뮬레이션할 수는 없지만, 더 강력한 비서를 개발하는 데 도움이 됩니다. 관련 연구 논문은 참고할 수 있습니다. 대화 뒤집기: 사용자 언어 모델 훈련 및 평가 .
이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 5090 카드 두 개입니다.
2. 효과 예시

3. 작업 단계
1. 컨테이너를 시작하세요

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
사용 방법

인용 정보
@inproceedings{naous2025flipping,
title={Flipping the Dialogue: Training and Evaluating User Language Models},
author={Tarek Naous and Philippe Laban and Wei Xu and Jennifer Neville},
journal={arXiv preprint arXiv:2510.06552},
year={2025},
url={https://arxiv.org/abs/2510.06552}
}