2ヶ月前

大規模言語モデルとハリー・ポッター:対話エージェントとキャラクターを合わせるための二言語データセット

Nuo Chen; Yan Wang; Haiyun Jiang; Deng Cai; Yuhan Li; Ziyang Chen; Longyue Wang; Jia Li
大規模言語モデルとハリー・ポッター:対話エージェントとキャラクターを合わせるための二言語データセット
要約

近年、ChatGPTやGPT-4などの対話型大規模言語モデル(LLM)は、オープンドメインの対話エージェントを構築する上で大きな可能性を示しています。しかし、これらのエージェントを特定のキャラクターまたは個人に合わせるには、キャラクター表現の複雑さと包括的な注釈の不足という課題が依然として存在します。本論文では、対話エージェントとキャラクターアライメントの研究を進めるために設計された「ハリー・ポッター対話データセット(Harry Potter Dialogue: HPD)」を紹介します。このデータセットは、「ハリー・ポッター」シリーズにおけるすべての対話セッション(英語版および中国語版)を網羅し、対話シーン、発話者、キャラクター間の関係性、属性など重要な背景情報を注釈しています。これらの広範な注釈により、LLMがキャラクタードリブンな対話機能を解錠できる可能性があります。さらに、LLMが特定のキャラクターにどの程度アライメントできるか評価するための普遍的なベンチマークとしても機能できます。私たちはファインチューニングとコンテキスト内学習の両設定でHPD上でLLMをベンチマークしました。評価結果は、高品質でキャラクターにアライメントした応答生成において大幅な改善余地があることを示していますが、提案されたデータセットはモデルをハリー・ポッターらしさのある応答へと導く上で価値があることが確認されました。

大規模言語モデルとハリー・ポッター:対話エージェントとキャラクターを合わせるための二言語データセット | 最新論文 | HyperAI超神経