
要約
科学分野(専門領域)における対話エージェントの応用は、そのようなエージェントを訓練するための対話データの不足により十分に研究されていません。Amazon Mechanical Turkなどの大多数のデータ収集フレームワークは、クラウドワーカーとタスクデザイナーを結びつけることで一般的な領域でのデータ収集を促進していますが、これらのフレームワークは専門領域でのデータ収集には最適化されていません。科学者たちは時間的な制約があるため、これらのフレームワークにほとんど参加していません。そこで、我々は科学論文に関する科学者(専門家として)間の対話を収集する新しいフレームワークを提案します。当該フレームワークでは、科学者が自身の論文を対話の基盤として提示し、興味のある論文タイトルに基づいて対話に参加することができます。このフレームワークを使用して、新たな議論型対話データセットArgSciChatを収集しました。これは20篇の科学論文に関する41件の対話から得られた498件のメッセージで構成されています。ArgSciChatについて広範な分析を行い、最近開発された対話エージェントを当該データセット上で評価しました。実験結果は、このエージェントがArgSciChatにおいて性能が低いことを示しており、議論型科学エージェントに関するさらなる研究が必要であることを示唆しています。我々は本フレームワークおよびデータセットを公開します。