Command Palette
Search for a command to run...
UserLM-8b: ユーザー対話シミュレーションモデル
1. チュートリアルの概要
UserLM-8bは、Microsoftが2025年10月に発表したユーザー行動シミュレーションモデルです。会話における「アシスタント」の役割を担う一般的なLLMとは異なり、UserLM-8bは会話における「ユーザー」の役割をシミュレートするために使用され(WildChat会話コーパスのトレーニングに基づく)、大規模アシスタントの能力を評価するために使用できます。このモデルは一般的な大規模アシスタントとは異なり、より現実的な会話をシミュレートしたり問題を解決したりすることはできませんが、より強力なアシスタントの開発に役立ちます。関連する論文の結果は次のとおりです。対話を反転させる:ユーザー言語モデルのトレーニングと評価”。
このチュートリアルで使用されるコンピューティング リソースは、デュアル RTX 5090 カードです。
2. 効果例

3. 操作手順
1. コンテナを起動します

2. Web ページに入ると、モデルと会話を開始できます。
「Bad Gateway」と表示される場合、モデルが初期化中であることを意味します。モデルが大きいため、2〜3分ほど待ってページを更新してください。
利用手順

引用情報
@inproceedings{naous2025flipping,
title={Flipping the Dialogue: Training and Evaluating User Language Models},
author={Tarek Naous and Philippe Laban and Wei Xu and Jennifer Neville},
journal={arXiv preprint arXiv:2510.06552},
year={2025},
url={https://arxiv.org/abs/2510.06552}
}