HyperAIHyperAI

Command Palette

Search for a command to run...

UserLM-8b: 사용자 대화 시뮬레이션 모델

날짜

7달 전

조직

Microsoft

태그

논문 URL

2510.06552

라이선스

MIT

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)
지금 사용하기

1. 튜토리얼 소개

UserLM-8b는 마이크로소프트가 2025년 10월에 출시한 사용자 행동 시뮬레이션 모델입니다. 대화에서 "비서" 역할을 하는 일반적인 LLM과 달리, UserLM-8b는 대화에서 "사용자" 역할을 시뮬레이션하도록 설계되었으며(WildChat 대화 코퍼스로 학습됨), 대규모 비서 모델의 성능을 평가하는 데 사용할 수 있습니다. 이 모델은 일반적인 대규모 비서 모델이 아니므로 보다 현실적인 대화나 문제 해결을 시뮬레이션할 수는 없지만, 더 강력한 비서를 개발하는 데 도움이 됩니다. 관련 연구 논문은 참고할 수 있습니다. 대화 뒤집기: 사용자 언어 모델 훈련 및 평가 .

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 5090 카드 두 개입니다.

2. 효과 예시

3. 작업 단계

1. 컨테이너를 시작하세요

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.

사용 방법 

인용 정보

@inproceedings{naous2025flipping,
  title={Flipping the Dialogue: Training and Evaluating User Language Models},
  author={Tarek Naous and Philippe Laban and Wei Xu and Jennifer Neville},
  journal={arXiv preprint arXiv:2510.06552},
  year={2025},
  url={https://arxiv.org/abs/2510.06552}
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp