11日前

オンラインディスコースにおけるコンテキスト区切りを用いた皮肉検出

Kartikey Pant, Tanvi Dadu
オンラインディスコースにおけるコンテキスト区切りを用いた皮肉検出
要約

皮肉は意味を間接的に伝える複雑な言語表現形式であり、その構造の複雑さから、皮肉の検出は困難な課題である。皮肉の認識に際しては、日常的なコミュニケーションにおける誤解を招く多くのリスクが存在しており、その結果、自動皮肉検出への関心が高まっている。第2回目の比喩的言語処理ワークショップ(Figurative Language Processing, FigLang 2020)において、皮肉検出の共同タスクとして、TwitterおよびRedditから抽出された文脈と応答を含む2つのデータセットが公開された。本研究では、これらのデータセットにおける皮肉検出にRoBERTa_largeを用いた。さらに、文脈の重要性を強調するために、3種類の入力形式——「応答のみ(Response-only)」、「文脈+応答(Context-Response)」、「文脈と応答を分離した形式(Context-Response (Separated))」——を比較検証した。その結果、提案するアーキテクチャが両データセットにおいて競争力のある性能を発揮することを示した。また、文脈と応答の間に分離トークン(separation token)を挿入することで、RedditデータセットにおいてF1スコアが5.13%向上することを明らかにした。

オンラインディスコースにおけるコンテキスト区切りを用いた皮肉検出 | 最新論文 | HyperAI超神経