11 天前
UVCE-IIITT@DravidianLangTech-EACL2021:泰米尔语网络恶搞图片分类:需要投入更多关注
Siddhanth U Hegde, Adeep Hande, Ruba Priyadharshini, Sajeetha Thavareesan, Bharathi Raja Chakravarthi

摘要
泰米尔语是一种属于达罗毗荼语系的语言,广泛使用并通行于亚洲南部地区。在社交媒体时代,网络迷因(meme)已成为人们日常生活中充满趣味的组成部分。本文旨在通过将泰米尔语迷因划分为“挑衅型”与“非挑衅型”两类,深入分析其真实语义。为此,我们提出了一种创新的模型架构——基于Transformer-Transformer的双通道结构,以注意力机制为核心组件,力求达到当前最先进的分类性能。该数据集包含带有文本描述的挑衅型与非挑衅型图像,任务为二分类。模型的目标是重点关注从图像与文本中提取的关键特征,同时有效抑制两者中的噪声干扰。