2 个月前
希望言论检测在资源不足的卡纳达语中
Adeep Hande; Ruba Priyadharshini; Anbukkarasi Sampath; Kingston Pal Thamburaj; Prabakaran Chandran; Bharathi Raja Chakravarthi

摘要
近年来,为了监测社交媒体平台上的负面情绪传播,已经开发了多种方法来消除粗俗、冒犯性和激烈的评论。然而,关于如何促进正面情绪的研究相对较少,特别是如何在在线论坛中强化支持性和安慰性的内容。因此,我们提出创建一个英-卡纳达语(Kannada)希望言论数据集——KanHope,并通过多个实验对其进行基准测试。该数据集包含从YouTube抓取的6,176条用户生成的混合编码卡纳达语评论,并由人工标注为希望言论或非希望言论。此外,我们引入了DC-BERT4HOPE模型,这是一种双通道模型,利用KanHope的英文翻译进行额外训练以提升希望言论检测的效果。该方法实现了加权F1分数0.756,优于其他模型。因此,KanHope旨在激发卡纳达语领域的研究,并广泛鼓励研究人员采取务实的态度对待能够促进积极和支持性的在线内容。