2ヶ月前

会話における文脈に基づく毒性検出の再検討

Atijit Anuchitanukul; Julia Ive; Lucia Specia
会話における文脈に基づく毒性検出の再検討
要約

ユーザー間の会話における毒性の理解は、疑いなく重要な問題である。特に「隠れた」または暗黙的な毒性のケースに対処することは難しく、コンテキストが必要となる。これまでの研究で、対話コンテキストが人間の認識や自動検出モデルに及ぼす影響を分析したものは非常に少ない。本研究では、これらの方向性についてより深く掘り下げた。まず、既存のコンテキストデータセットを分析し、人間による毒性ラベリングが一般的に対話構造、極性(ポジティビティ/ネガティビティ)、およびトピックによって影響を受けているという結論に達した。次に、これらの知見を計算機検出モデルに導入することを提案し、(a) 対話構造を意識した文脈毒性検出用のニューラルアーキテクチャと (b) 文脈毒性検出モデルを支援するためのデータ拡張戦略を導入・評価した。結果は、対話構造を意識したニューラルアーキテクチャが有望な可能性を持つことを示している。また、特にソーシャルメディア領域において、このようなモデルが合成データから利益を得られることも示された。

会話における文脈に基づく毒性検出の再検討 | 最新論文 | HyperAI超神経