2ヶ月前

ChatGPTを用いた構成的一般化のためのデータ拡張:オープンな意図検出における事例研究

Yihao Fang; Xianzhi Li; Stephen W. Thomas; Xiaodan Zhu
ChatGPTを用いた構成的一般化のためのデータ拡張:オープンな意図検出における事例研究
要約

オープンインテント検出は、自然言語理解の重要な側面であり、ユーザーが生成したテキストからこれまでに見たことのないインテントを特定することを目的としています。この分野での進歩にもかかわらず、言語成分の新しい組み合わせを処理するという課題が残っており、これは合成的一般化(compositional generalization)にとって不可欠です。本論文では、ChatGPTをデータ拡張技術として利用し、オープンインテント検出タスクにおける合成的一般化能力を向上させるための事例研究を行います。まず、この問題の評価において既存のベンチマークに限界があることを議論し、オープンインテント検出タスクにおける合成的一般化に対応するためのデータセット構築の必要性を強調します。ChatGPTによって生成された合成データを学習プロセスに取り入れることで、当方針がモデル性能を効果的に向上させられることが示されました。複数のベンチマークによる厳密な評価により、当方法が既存の技術よりも優れており、オープンインテント検出能力を大幅に向上させていることが明らかになりました。これらの結果は、ChatGPTのような大規模言語モデルが自然言語理解タスクにおけるデータ拡張に大きな可能性を持っていることを示唆しています。

ChatGPTを用いた構成的一般化のためのデータ拡張:オープンな意図検出における事例研究 | 最新論文 | HyperAI超神経