Command Palette
Search for a command to run...
Ali Montazeralghaem Guy Tennenholtz Craig Boutilier Ofer Meshi

要約
大規模言語モデル(LLM)の進展により、推薦システムがオープンエンドな会話インターフェースを通じてユーザーと対話することができるようになった。ユーザーの好みを正確に把握するためには、特にユーザー履歴が限られている場合に、ユーザーの好みを引き出すことが重要となる。その手段の一つとして、ユーザーに対して明確化質問を提示する方法がある。しかし、さまざまな領域にわたって効果的な順次的明確化質問を生成することは依然として課題である。本研究では、ユーザーの好みを明らかにするための順次質問を提示できるようにLLMを訓練するための新規アプローチを提案する。本手法は、拡散モデル(diffusion model)をヒントにした二段階プロセスに基づいている。まず、ユーザーのプロファイルから出発し、前向きプロセスとして明確化質問を生成して回答を得た後、その回答を段階的に削除することで、ユーザーのプロファイルに「ノイズ」を加える。その後の逆過程では、このノイズが加えられたプロファイルを「復元」するようモデルを学習させる。具体的には、効果的な明確化質問を提示する能力を学習させることで、ユーザーの好みを効果的に引き出す。実験結果から、本手法がLLMの「ファンネル質問」(段階的に情報を絞り込む質問)の提示能力を顕著に向上させ、ユーザーの好みを効果的に引き出せることが明らかになった。