11日前
UTNLP at SemEval-2022 Task 6: GenerativeベースおよびMutationベースのデータ拡張を用いた皮肉検出の比較分析
Amirhossein Abaskohi, Arash Rasouli, Tanin Zeraati, Behnam Bahrak

要約
皮肉は、相手をからかう、いらだたせる、あるいは面白がる目的で言葉を用いる表現を指す。この表現はソーシャルメディアにおいて広く用いられている。皮肉は比喩的かつ創造的な性質を持つため、感情計算(affective computing)に基づくセンチメント分析システムにとって大きな課題となっている。本論文では、UTNLPチームがSemEval-2022共有タスク6「皮肉検出」において採用した手法とその成果を報告する。異なるモデルとデータ拡張手法を比較検証し、最も効果的なアプローチを明らかにする。評価は従来の機械学習モデルから始まり、Transformerベースおよびアテンション機構を用いたモデルへと進む。データ拡張には、データ変異(data mutation)とデータ生成(data generation)を活用した。RoBERTaモデルと変異に基づくデータ拡張を組み合わせた最良のアプローチは、コンペティションの評価フェーズにおいてF1スコア(皮肉に対する)0.38を達成した。コンペティション終了後、モデルの欠陥を修正した結果、F1スコア(皮肉に対する)は0.414まで向上した。